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Verwendung des multifunktionellen Transkriptionsf aktors 
Yin- Yang- 1 und Varianten davon zur Behandlunq von Erkrankun- 
gen, insbesondere von Typ-1 Diabetes 



Die vorliegende Erfindung betrifft die Beeinf lussung der Akti- 
vitat und/oder der Expression des multifunktionellen Tran- 
skriptionsf aktors Yin- Yang- 1 (YY1) und Varianten davon zur Be- 
handlung verschiedenster Erkrankungen . Die Erfindung betrifft 
insbesondere eine mutierte Nukleinsauresequenz, die fur eine 
Variante des humanen YY1 kodiert und der erf indungsgemaS eine 
diabetesprotektive Wirkung. zugeschrieben wird. 

Einfiihrung 

Der insulinabhangige Typ-l -Diabetes (IDDM- Insulin-Dependent 
Diabetes Mellitus) ist eine komplexe Erkrankung, bei der zel- 
lulare und humorale Itnmunprozesse ablaufen, die eine Zersto- 
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rung der korpereigenen Insulin-produzierenden Beta-Zellen zur 
Folge haben. Man spricht daher beim Typ-1 -Diabetes von einer 
Autoinununerkrankung. Es besteht heute kein Zweifel mehr, daS 
der Typ-l-Diabetes genetisch determiniert ist. Gesichert ist, 
daS bestimmte Klasse-II-Gene des Haupthistokompatibilitatskom- 
plexes (MHC) , der beim Menschen als HLA (Human Leucocyte Anti- 
gens) bezeichnet wird, an der Entstehung des Typ-l-Diabetes 
beteiligt, aber allein nicht ausreichend sind. Diese diabetes - 
suszeptiblen Klasse-II-Gene, die als IDDM1 bezeichnet werden, 
erklaren nur etwa 40% des Risikos, an einem Typ-1 -Diabetes zu 
erkranken. Daher wurde in den letzten Jahren versucht, chromo- 
somale Regionen mit diabetogenen Nicht-MHC-Genen zu lokali- 
sieren. Im Ergebnis dieser Studien wurden bis dato mehr als 17 
Nicht -MHC-Gene ( IDDM2 , IDDM3 7 IDDM4 etc J, die auf verschiede- 
nen Chromosomen kartieren, beschrieben. Mit Ausnahme des IDDM2 
und IDDM18, bei denen das diabetogene Gen bekannt ist, sind 
bei den anderen IDDM*s die entsprechenden Gene immer noch un- 
bekannt (1,2) . 

Bei der Identif ikation dieser Nicht -MHC-Gene sind Modelltiere, 
die ahnlich dem Menschen einen Typ-1 -Diabetes entwickeln, sehr 
hilfreich. Als. Modelltier fur den Typ-1 -Diabetes ist die spon- 
tan diabetische BB/0 (ttawa) K(arlsburg) -Ratte ausgezeichnet ge- 
eignet, da dieses Modelltier sowohl klinisch, als .auch atiopa- 
thogenetisch ein hohes MaS an Analogien zum menschlichen Typ- 
1 -Diabetes aufweist (3-7) . Auch bei der BB/OK-Ratte sind die 
Klasse-II-Gene des MHC essentiell aber nicht ausreichend fur 
die Diabetesentwicklung. Die BB/OK-Ratte ist homozygot fur den 
MHC-Haplotyp RT1 U . Analog dem Menschen wird dieses diabetogene 
Gen als Iddml bezeichnet. Neben diesem Genkomplex ist bei der 
BB/OK-Ratte allerdings noch ein wei teres Gen, Iddm2, fiir die 
Diabetesentwicklung erforderlich. Es handelt sich dabei urn ein 
Gen (1) , daS eine Lymphopenie verursacht, rezessiv vererbt und 
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als Iddm2 bezeichnet wird. DaS beide diabetogenen Gene, Iddml 
und Iddm2, zwar essentiell aber nicht ausreichend sind, wurde 
durch verschiedene Kreuzungsstudien unter Nutzung diabetischer 
BB/OK-Ratten und verschiedener diabetesresistenter Rattenstam- 
rae belegt (8-11). Gleichgiiltig, ob diabetesresistente LEW.1A, 
DA, SHR Oder wilde Ratten (12) mit diabetischen BB/OK-Ratten 
gekreuzt wurden, entwickelte kein Fl-Hybrid und nur etwa 50% 
der fur beide diabetogenen Gene Iddml und Iddm2 bereits homo- 
zygoten ersten Ruckkreuzungshybriden (Rl) einen Typ-1- 
Diabetes. Der Prozentsatz von 50% an diabetischen Tieren bei 
den fur Iddml und Iddm2 bereits homozygoten Rl-Hybriden weist 
darauf hin, daS mindestens ein weiteres diabetogenes Gen, 
Iddm3, fur die Entwicklung eines Diabetes bei BB/OK-Ratten 
notwendig ist. Die genomweite Suche nach diesem dritten Gen in 
zwei Kreuzungspopulationen, [(BB x DA) Fl x BB] und [(BB x SHR)F1 
x BB], zeigte, daS dieses „dritte Gen n nicht nur ein Gen ist. 
Es wurden zwei diabetogene Gene, Iddm3 und Iddm4, auf Chromo- 
som 18 bzw. 6 und ein Diabetes-protektives Gen, Iddm5r, auf 
Chromosom 1 kartiert (13,14). Wahrend Iddm3 in beiden Kreu- 
zungspopulationen nachgewiesen und damit bestatigt wurde (13) , 
waren Iddm4 und Iddm5r nur bei [(BB x SHR)F1 x BB] Rl-Hybriden 
nachweisbar (14) . 

Vergleicht man die homologen Bereiche zwischen Ratte und 
Mensch, zeigt sich, daS beim Menschen die homologen Regionen 
fur Iddm3 auf 18q21-q23, Iddm4 auf 14q24-q32 und Iddm5r auf 
llpl5 kartieren. Es handelt sich dabei urn Bereiche, bei denen 
auch beim Menschen die diabetogenen Gene IDDM6 auf 18q21-23 
(Iddm3) , IDDM11 auf 14q24-q32 (Iddm4) und IDDM2 auf llpl5 
(Iddm5r) kartiert wurden (15-17) . 
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Aufgabe der vorliegenden Erfindung ist es daher zunachst, die 
diabetogenen Gene zu identifizieren und therapeutische Ansatze 
zur Verhinderung der Typ-l-Diabetes zu forraulieren. 

Im Rahmen der Erfindung wurde uberraschenderweise ein Gen 
identifiziert, das im diabetesprotektiven chromosomalen Be- 
reich liegt, dessen mutierte Varianten geeignet sind, im Rat- 
tenmodell Typ-1 -Diabetes zu verhindern. Infolge dieser Er- 
kenntnis steht damit erstmals ein wichtiger therapeutischer 
Ansatz fur Diagnose und Praventivtherapie von Typ-l-Diabetes 
zur Verfugung. Daruber hinaus ergeben sich durch weitere, er- 
findungsgemaS gewonnene Erkenntnisse vielfaltige zusatzliche 
Anwendungsmoglichkeiten, die nachfolgend ebenfalls beschrieben 
werden. 

Vorarbeiten 

Um zu priifen, welche Bedeutung die kartierten Iddm's der 
BB/OK-Ratte tatsachlich bei den Entstehung eines Typ-l- 
Diabetes haben, wurden verschiedene kongene BB/OK-Rattenlinien 
etabliert . 

Neben den bereits beschriebenen kbngenen BB.SHR-Linien (BB.1K, 
BB.Sa, BB.LL, BB.Bp2, BB.Xs) wurden zwei weitere BB.SHR-Linien 
etabliert (18-24) . Es wurde ein Bereich von Chromosom 6 
(D6Ratl84 - Iddm4 - D6Rat3, ca.15 cM) und einer von 18 (Olf - 
Iddm3 -D18Rat44 ; ca.24 cM) der BB/OK-Ratte durch den der SHR- 
Ratten ersetzt (24) . Die phanotypische Charakterisierung die- 
ser neu etablierten BB-Linien, kurz als BB.6S und BB.18S be- 
zeichnet, zeigte, daS die Diabetesinzidenz in beiden Kongenen 
gesenkt werden konnte, besonders allerdings bei der kongenen 
BB.6S-Linie (24). Wahrend ca. 86% aller BB/OK-Ratten einen 
Typ-l-Diabetes bis zur 32. Lebenswoche entwickeln, erkrankten 
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im gleichen Zeitraum in der neu etablierten BB.6S-Linie nur 
14% und das, obwohl die BB.6S-Tiere homozygot fur Iddml und 
Iddm2 sind und im Restgenom der BB/OK-Ratte entsprechen, wie 
durch einen genomweite Analyse bestatigt wurde (24) . D.h. die 

Wirkung — beider — essentiellen diabetoae nen Gene . Iddml und 

Iddm2, wird durch ein oder mehr Gen/e auf dem trans feriert en 
Bereich der diabetes-resistenten SHR-Ratte nahezu vollstandig 
unterdriickt . Ein Ergebnis, welches bis dato einmalig ist. 
Selbst bei der N(on)0(besen)D(iabetischen) -Maus, auch ein Mo- 
dell fur den Typ-l-Diabetes, wurden diabetogene Gene kartiert 
und analog kongene NOD-Linien etabliert, urn den in vivo-Effekt 
dieser Gene zu priifen. Eine drastische Senkung der Diabetesin- 
zidenz wurde durch Austausch eines diabetogenen chromosomalen 
Bereiches wie bei BB.6S bis dato nicht beschrieben. Eine ahn- 
lich deutliche Senkung der Diabetes inzidenz wie bei BB.6S wur-> 
de nur durch Austausch von 2 und mehr chromosomalen Regionen 
der NOD durch die diabetes-resistenten Stamme erreicht 
(25-28) . 

Unterschiede zwischen BB/OK- und BB.6S -Ratten wurden auch beim 
Manifestationsalter und bei den Lymphozytenphanotypen nachge- 
wiesen. BB.6S-Ratten manifestieren signifikant spater (137 ± 
14 vs. 103 ± 30 Tage, p<0,001) und haben signifikant weniger 
aktivierte T-Lymphotzyten als BB/OK-Ratten (36,6 ± 6,9 vs. 
65,6 ± 18,4 %, p<0,0001) (24). Daruber hinaus werden BB. 6Sr 
Ratten signifikant schwerer und haben signifikant hohere 
Serumcholesterolwerte als BB/OK-Ratten (24) . 

Da auch bei der SHR-Ratte immunologische Phanomene beschrieben 
wurden (29-31) , wurde die drastische Senkung der Diabetesinzi- 
denz von 86% bei BB/OK auf 14% bei BB. 63 zunachst in der Weise 
interpretiert, daS in der trans ferier ten Region ein SHR-Gen 
oder SHR-Gene lokalisiert ist/sind, dessen/deren Produkt/e die 
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Autoaggression der diabetogenen Genprodukte der BB-Ratte weit- 
gehend „ neutral isier en 11 kann/konnen. Diese Annahme wurde durch 
die Etablierung einer weiteren kongenen BB/OK-Rattenline un- 
terstrichen. 

Neben diabetesresistenten SHR-Ratten wurden auch Wildfangrat- 
ten zur Erzeugung von kongenen BB . K (arlsburg) W ( ild) R (atte) - 
Ratten verwendet. Analog der BB.6S-Linie wurde der gleiche 
chromosomale Bereich der BB/OK von 15 cM durch den von Wild- 
fangtieren ausgetauscht (BB.6W). Die Erkrankungshauf igkeit in 
dieser kongenen BB.6W-Linie ist mit der der BB/OK-Ratte ver- 
gleichbar (89% vs. 86%, 32). Daher wird erf indungsgem&S davon 
ausgegangen, daS die Diabetes -Protekt ion bei BB. 63 das Ergeb- 
nis einer „ neutral isierenden" Genwirkung der SHR-Ratte und 
nicht dem Ersatz von Iddm4 der BB/OK-Ratte anzulasten ist. 

Die Identif ikation der/des Gene/s war somit angezeigt, denn 
mit der Identif ikation des/der Gens/Gene ist die MSglichkeit 
verbunden, eine genspezif ische Behandlung und/oder Pravention 
des Typ-1 -Diabetes bzw. von Auto immune rkrankungen per se vor- 
nehmen zu konnen. 

Fortfuhrende Arbeiten zur Identif ikation des/der diabetespro- 
tektiven Gens /Gene 

Nach der Entschlusselvmg des menschlichen Genoms (ca. 40.000 
Gene) geht man heute davon aus, daS etwa 15-20 Gene pro cM und 
nicht wie bisher angenommen 50 Gene lokalisiert sind. Ausge- 
hend von dieser Annahme sollten in dem transferierten chromo- 
somalen Bereich der BB.6S-Ratte von ca. 15 cM etwa 225-300 Ge- 
ne kartieren. Angesichts dieser Zahl ist die Identif ikation 
von moglichen Kandidatengenen fur eine Diabetesprotektion ein 
aussichtsloses Unterfangen, weshalb subkongene BB. 6S-Ratten 
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erzeugt wurden, um den chromosomalen Bereich mit der diabete- 
sprotektiven Wirkung weiterhin einzugrenzen. 

BB . 6S-Ratten wurden mit diabetischen BB/OK-Ratten gekreuzt . 

Die resultierenden Fl-Hybriden fur den Bereich auf Chromosom 6 

wurden untereinander gepaart (intercross) und genetisch analy- 

siert, wobei das Markerspekrum erweitert wurde, um moglichst 

Rekombinationen in kleinen Bereiche erkennen zu konnen: 

D6Rat3 -D6Rat 1 -D6woxl3 -D6Rat 101 - Ighe/Ckb-D6Mgh2 -D6Rat 94 - 

D6Ratl83-D6Ratl0-D6Rat7-D6Rat75-D6Rat9-D6Rat6-D6Ratl60-D6Mgh9- 
D6Ratl84. 

Die Zuordnung der Linien mit Diabetesprotektion erfolgte nach 
der Erkrankungshaufigkeit. Erkrankten bereits mehr als 50% der 
Nachkommen einer subkongenen Linie vor dem 100. Lebenstag, 
sprach dieser Phanotyp fur den der BB/OK-Ratte und die Linie 
wurde eliminiert. Erkrankten weniger als 15% bis zum 100. Le- 
benstag, zeigte diese Linie den Phanotyp von BB.6S. Diese Li- 
nien wurden fur die Weiterzucht zwecks Minimierung der Diabe- 
tes -pro tektiven Region eingesetzt. Durch die Etablierung ver- 
schiedener subkongener Linien (BB. 6Sa,b, c. . ) mit dem Phanotyp 
der BB.6S-Ratte, wurde der in Frage kommende chromosomale Be- 
reich auf < 2 cM ( 30-40 Gene) eingegrenzt. 

Wie nachfolgend dargestellt, kartiert das diabetesprotektive 
Gen um den Locus D6Mgh2. 
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Der Locus D6Mgh2 ist ein Mikrosatellit im Efl-Gen. Efl ist ein 
Pseuddgen und kartiert beim Menschen auf Chromosom 14q32 und 
bei der Maus auf Chromosom 12ql4. Nach Angaben der Chromoso- 
menkarte von Watanabe et al. (33) soil auf Chromosom 6q32 der 
Ratte auch das Gen Macs kartieren (http: / /ratmap. ims .u- 
hnk yo.ac.jp) . Dieses Gen ist aber beim Menschen auf Chromosom 
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6q21-6q22.2 und nicht auf 14q32 lokalisiert worden. Falls dies 
zutreffen wurde, bedeutet es, daS 6q32 der Ratte sowohl homo- 
log zum humanen Chromosora 14q32, als auch 6q21-6q22.2 sein 
kann. Zwecks Kandidatengensuche war es notwendig, abzuklaren, 
ob Macs tatsachlich auf dem Rattenchromosom 6q32 kartiert. 
Durch einen Polymorphismus im Macs -Gen (zwischen 901 und 1321, 
KWR hat 1 Aminosaure mehr) zwischen BB/OK und Wildfangtieren 
(KWR) wurden die Sequenzen zwischen BB/OK, KWR und BB.KWR 
(Chr. 6; BB.6W) verglichen. Alle BB.6W-Tiere zeigten den Geno- 
typ der BB/OK-Ratte. Dadurch konnte ausgeschlossen werden, dafi 
Macs auf Chromosom 6q32 der Ratte lokalisiert ist und damit 
ein Kartierungsfehler vorliegt. Dadurch konnte die Kandidaten- 
gensuche durch Homologievergleiche auf 12ql3 der Maus und 
14q32 des Menschen beschrankt werden. 

Da im diabetesprotektivem Bereich auch das Gen Aktl/Pkb kar- 
tiert, welches essentiell fur die fi-Zellfunktion ist (34, 35), 
wurde zunachst versucht, Aktl/Pkb relativ genau in der Region 
zu positionieren. Da BB/OK und SHR polymorph sind (Intron zwi- 
schen 1321 und 1561), konnte mit Hilfe der subkongenen BB.6S- 
Linien Aktl/PKB zwischen Ighe und Ckb, also auSerhalb der dia- 
betesprotektiven Region, kartiert werden. Damit schied dieses 
Gen als moglicher Kandidat aus. 

Durch die parallel laufende in vivo-Charakterisierung der 
,BB.6S-Ratten im Vergleich zum Parentalstamm BB/OK wurden wei- 
tere Erkenntnisse zur Punktion des mdglichen Kandidatengens 
gewonnen: 

1. Morphologische Untersuchungen des Pankreas von normoglyka- 
mischen BB/OK- und BB,6S-Ratten zeigten signifikante Unter- 
schiede auf. Im Alter von 30 Tagen waren bei BB.6S signifi- 
kant mehr Langerhanssche Inseln mit Lymphozyten infiltriert 
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(Insulitis) als bei BB/OK. Bei jeweils 12 untersuchten 
BB.6S bzw. BB/OK waren 51,2 ± 4,6% bzw. 7,5 ± 2,5 % 
(p<0 / 001) der Inseln infiltriert. Im Alter von 90 Tagen war 
der Prozentsatz an Inseln mit Insulitis zwischen beiden 
Stammen vergleichbar und lag bei etwa 50% (37) . Demnach 
tritt sowohl bei BB/OK als auch bei BB.6S eine Insulitis 
auf, die bei BB/OK bei etwa 86% der Tiere und bei BB.6S nur 
bei etwa 14% zur Zerstorung der Beta-Zellen und damit zum 
Typ-1 -Diabetes fiihrt, was fur die Induktion einer Immunto- 
leranz bei BB.6S sprechen konnte. 

Signifikante Unterschiede fanden sich auch zwischen frisch- 
manifestierten, diabetischen BB/OK und BB.6S im Insulinge- 
halt und Prozentsatz Insulin-positiver fi-Zellen. Im Ver- 
gleich zu diabetischen BB/OK war der Insulingehalt (0,15 ± 
0,03 vs. 0,42 ± 0.13 pmol/mg, p<0,05) und der Prozentsatz 
Insulin-positiver S-Zellen (0,07 ± 0,02 vs. 0,19 ± 0,06%, 
p<0,05) signifikant niedriger als bei diabetischen BB.6S, 
was dafur sprechen konnte, dafi die Zerstorung der Insulin- 
produzierenden S-Zellen nicht so aggressiv wie bei BB/OK - 
Ratten ablauft (37) . 

2. Untersuchungen zur Frakturheilung bei BB/OK- und diabetes - 
resistenten LEW. 1A,-Ratten (38) zeigten, daS der Knochen der 
BB/OK-Ratte deutlich bruchiger als der von LEW. 1^-Ratten 
war, was auf eine mogliche Stoning im Calcium-Stof fwechsel 
der BB/OK hinwies. Verschiedene Untersuchungen zum Calcium- 
Stof fwechsel ergaben allein signifikante Unterschiede im 
Serumcalcitoningehalt zwischen BB/OK und BB. 6S -Rat ten. Si- 
gnifikant hohere Calcitonwerte wurden bei BB/OK als bei 
BB.6S nachgewiesen (2,4 ± 1,57 vs. 1,0 ± 0,65 pmol/ml; 
p=0,0002). Da Calcitonin nicht nur die Calcium-Freisetzung 
des Knochens hemmt, sondern ebenso iiber verschiedene Protei- 
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ne und Rezeptoren die Insulinsekretion hemmen kann (39,40), 
wurde versucht, durch Modulation der Calcium- Zufuhr uber die 
Nahrung von BB/OK und BB.6S einen weiteren Hinweis zum Zu- 
sammenspiel von Calcium (Ca) und Diabetesmanifestation zu 
erhalten. 

BB/OK und BB. 6S -Ratten wurden mit Standarddiat (0,8% Ca) , 
mit Ca-reicher (2%) und Ca-armer Diat (0,4%) ernahrt und bis 
zur 30. Lebenswoche auf Diabetesentwicklung beobachtet. Wah- 
rend bei BB/OK-Ratten kein EinfluS der Diat auf die Erkran- 
kungshaufigkeit nachweisbar war (Kontrolle=88%; Ca-arm=92%; 
Ca-reich=90%) , erkrankten bei BB.6S-Ratten signifikant mehr 
Tiere an einem Diabetes, wenn sie mit Ca-reicher Diat er- 
nahrt wurden (Kontrolle=12%; Ca-arm=18%; Ca-reich= 45%, 
p=0.02). Daruber hinaus fuhrte die Ca-reiche Ernahrung zur 
Angleichung der Korpermasse und des Serumcholsterolgehaltes 
bei BB/OK und BB.6S. Signifikante Unterschiede zwischen bei- 
den Linien traten bis zur 30. Lebenswoche nicht auf. Weitere 
in vivo-Manipulationen, wie Verabreichung von Ca-Kanal- 
Blockern oder verschiedenen Ca-Antagonisten, ergab keinerlei 
in vivo-Effekte. 

. In vitro Untersuchungen an isolierten Langerhansschen In- 
seln von BB/OK- und BB.6S- Ratten zeigten, daS durch Varia- 
tion der Ca-Konzentration im Kulturmedium weder der Insulin- 
gehalt, noch die glukosestimulierte Insulinsekretion zwi- 
schen beiden Linien differierte. 

Signifikante Unterschiede fanden sich jedoch bei der Protei- 
nexpression mittels Westernblottanalyse . Das Ca-bindende 
Protein, Calbindin-D28k, war in Inseln von BB.6S-Ratten be- 
reits unter Basalbedingungen doppelt so hoch wie das von 
BB/OK-Ratten. Zunehmende Ca-Konzentration im Medium erhohte 
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deutlich die Proteinexpression von Calbindin-D28k bei BB.6S- 
Inseln wahrend die Expression bei BB/OK-Ratten durch Ca fast 
unbeeinfluSt blieb. Calbindin-D28k ist ein cytosolisches Ca- 
bindendes Protein, welches bevorzugt in der Niere, aber auch 
im Pankreas und Gehirn exprimiert wird und den apoptotischen 
(gengesteuerten) Zelltod verhindern kann (41,42). Funktional 
wird vermutet, dafi Calbindin-D28k bei der Regulation der Ca- 
Reabsorption beteiligt ist. 



Da das Kandidatengen 

1. die zwei essentiellen diabetogenen Gene, Iddml und Iddm2, 
nahezu ausschalten kann, 

2. bei der Immuntoleranz und beim apoptotischen Zelltod, 

3. als auch bei der Regulation von Ca, Ca-bindenden Proteinen 
(Calbindin-D28k u.a.) und Hormonen (Calcitonin, u.a.), 

4. bei der Entstehung einer Dyslipidamie involviert ist, 

wurde der SchluS gezogen, daS das Gen ein multifunktioneller 
Transkriptionsfaktor ist. 

Das Kandidatengen 

Nach Homologievergleichen und Genfunktionspriifungen wurde der 
Transkriptionsfaktor Yin Yang-1 (YY1) , der mit hoher Wahr- 
scheinlichkeit in der diabetesprotektiven Region bei Mensch 
und Maus kartiert, im Rahmen der vorliegenden Erfindung als 
Kandidatengen favorisiert, denn er kann die Transkription ei- 
ner groSen Anzahl von zellularen und viralen Genen aktivieren, 
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aber auch hemmen bzw. karm selbst Transkription initiieren und 
entspricht damit einem multifunktionellem Transkriptionsfak- 
tor. 

YY1 gehort zu der Klasse der regulatorischen Transkriptions- 
faktoren (RTF) , d.h. die Bindung erfolgt sequenzspezif isch an 
proximale und distale Regulationselemente der DNA. Dartiber 
hinaus besitzt er die Fahigkeit, direkt oder indirekt einen 
EinfluS auf die Transkriptionmaschinerie zu nehmen. Durch sei- 
nen vielseitigen molekularen Strukturaufbau (Aktivierungsdoma- 
ne, Repressionsdomane, Zinkf ingerstrukturen) ist es ihm mog- 
lich, eine dif ferentielle Genaktivitat durchzufiihren* Das 
heiSt, er kann als zeitlicher, raumlicher, zellspezif ischer, 
organspezifischer oder signalvermittelnder Parameter fungie- 
ren. Seine Funktionsmodule erfxillen die Aufgaben der spezifi- 
schen DNA-Erkennung, der Transkriptionsaktivieinong, Transkrip- 
tionsrepression, aber auch die Interaktion tnit anderen Protei- 
nen. 

Genaufbau - Vergleich 

Das Protein von Yin Yang ist gekennzeichnet durch die lokale 
Anhaufung von Aspraginsaure (D) und Glutaminsaure (E) zwischen 
den AS-bereichen 43 bis 53. Der Abschnitt ist homolog 'zw. Rat- 
te und Mensch, jedoch unterscheidet sich die Anzahl und die 
Position von E und D voneinander. Die Ratte besitzt 5 x E und 
6 x D, wobei der Mensch uber 6 x E und 5 x D verfugt. Daran 
schlieSt sich ein His tidin- Cluster bei der Ratte von 54 bis 79 
und beitri Menscheri von 54 bis 82 an, Es fehlen 3 Histidine bei 
der Ratte gegeniiber der humanen Seqeuenz. Es folgt eine GA/GK 
reiche Domane von 154 bis 198 beim Menschen. Bei der Ratte ist 
dieser Positionsbereich urn 3 AS-Positionen in Richtung N- ter- 
minals Ende versetzt. (151-195). Die vier Zinkf inger der hu- 
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maneii Sequenz beginnen an Position 298 und enden an Position 
407. In der Rattensequenz erstreckt sich dieser Bereich von 
295 bis 404. Die gesamte AS-Lange betragt beim Menschen 414 
und bei der Ratte 411 AS (s. Sequenzprotokoll: SEQ ID NO: 2 und 
4; die Bezeichnung "SEQ ID NO: 11 entspricht hier und im folgen- 
den der Sequenzkennzahl "<400> fl nach WIPO Standard ST. 25) . 

Funktionelle Domanen 

Viele Forschergruppen haben die Stniktur und Funktion von YY1 
mit Hilfe von Deletionsmutantan, sowie mit Report erkonstrukt en 
analysiert. Diese Ergebnisse sind in Fig. 1 zusammengef aSt . 

Ubereinstimmend wurden zwei Aktivierungsdomanen gefunden. Sie 
sind im Bereich des N-terminalen Endes und in der Region des 
Zinkfingers lokalisiert. Daruber hinaus konnten von zwei Grup- 
pen weitere Domanen mit aktivierender Funktion in der Nahe des 
C-Terminus lokalisiert werden (397-414 und 370-397) (43,44). 
Man argument ierte die Maskierung der N-terminalen Aktivie- 
rungsdomane durch die C-terminale Domane, sowie daS bei Dele- 
tion der C-terminalen Domane die N-terminale Domane demaskiert 
wird, so daS YY1 als konstitutiver Aktivator agieren kann. 
Diese Ergebnisse fuhrten zu dem SchluS, daS nur unter bestimm- 
ten Bedingungen YY1 zum Aktivator wird. Es zeigte sich, daS 
das E1A in der Lage war, Yin Yang in einen Aktivator umzuwan- 
deln (43) . 

Repressionsdomanen konnten fur den Zinkf ingerbereich lokali- 
siert werden. Dabei werden dem Zinkf inger 1 und 2 die Repres- 
sionsaktivitat zugesprochen, wobei Zinkfinger 2 und 3 fur die 
DNA-Bindung zustandig sein sollen (45) . Bei Betrachtung der 
Rontgen-Cokristallstxuktur von Zinkfinger 2 und 3 stellte man 
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im Gegensatz dazu fest, daS diese in der Lage waren, an den 
Basen, sowie an das Phosphatruckgrat der DNA anzugreifen (46) . 
Pur den Zinkfinger 1 konnten Kontaktstellen nur fur das Phos- 
phatriickgrat und fur Zinkfinger 4 nur fur einige wenige Basen 
gezeigt werden. 

Weitere Repress ionsdomanen zeigten sich uberlappend mit der 
Aktivierungsdomane an den Positionen von 1 bis 201, sowie von 
170 bis 200 (47,48) . 

Die Interpretation dieser Ergebnisse von Thomas et al. (49) 
zeigten zusammenfassend, daS sich nur zwei Repress ionsdomanen 
im YY1 Gen befinden, im Bereich von 170 bis 200 und in der 
Zinkf ingerregion, die vielleicht zusammen interagieren konnen 
(vgl. Fig. 1) . 

Protein/Protein Interaktionen 

Yin Yang ist imstande, mit Proteinen, wie Transkriptionsfakto- 
ren und Coaktivatoren/Corepressoren zu interagieren. Zwei Do- 
manen, die interagieren sind die Bereiche urn 150 bis 170 (zen- 
trale Domane) , in denen die GA/GK reiche Domane mit Teilstuk- 
ken des Spacers, sowie die C-terminale Region und die Zinkfin- 
ger mit Teilen des Spacers lokalisiert sind. 

Einige Proteine, wie TBP # CBP/p300, TFIIB, E1A und c-MYC kon- 
nen an beide Regionen binden (43,45,47,50,51). Proteine, die 
nur mit einer dieser zwei Domanen interagieren konnen, sind: 
HDAC2 (zentrale Domane), SP1 und ATF/CREB (C-terminale Domane) 
(45,48,52-54) (vgl. Fig. 2). 
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Galvin and Shi demonstrierten (45), dafi die Repression von 
GREB und SP1 durch YY1 aktivator-spezif isch ist. Die Autoren 
prostulierten, dafi YY1 die Target (s) der Aktivatoren interfe- 
riert, anstelle von direkter Bindung zu diesen zwei Faktoren. 

Nur ein Protein, E1A, wurde bisher gefunden, welches direkt 
tnit der Aktivierungsdomane von YY1 interagiert (43 , 47 , 55 ) . 
Seit dieser Entdeckung wird diskutiert, ob YY1 seine Repres- 
sorfunktion in Richtung Aktivator auch verandern kann, mogli- 
cherweise durch Maskierung seiner Repress ionsdomanen uber Mo- 
difizierung, oder aber uber Freilegung seiner Aktivierungsdo- 
mane. 

Promotorbindung 

Ausgezeichnet durch vier Cys2 - Hi s2-Zinkf inger ist Yin Yang in 
der Lage, entweder die Transkription zu aktivieren oder zu in- 
hibieren, was jedoch von der Promotorsequenz der Gene und von 
der Konzentration des YY abh^ngig ist. Die Consensus -Sequenz 
(C/t/a)CATN(T/a) (T/g/c) , die in vielen Promotoren von viralen 
und zellularen Genen zu finden ist, kann iiber den Zinkf inger 
gebunden werden (56) . 

Repressionsmodelle 

Neben der geregelten Aktivierung der Transkription stellt auch 
dessen Repression einen wichtigen Kontrollmechanismus der Gen- 
aktivitat dar. Repression durch Dmkehrung bzw. Aufhebung gen- 
aktivierender Prozesse kann durch YY1 bewirkt werden. Im YY1- 
Genabschnitt wurden mehrere Repress ionsbereiche gefunden (sie- 
he Fig. 3) . 

Drei Modelle der Repressoraktivitat sind bis zum heutigen 
Stand bekannt. Im ersten Modell deplaziert YY1 den Aktivator. 
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Storende Eigenschaf ten weist er im zweiten Modell auf. Er be- 
hindert den Aktivator, sowie die generellen Transkriptionsfak- 
toren (GTF) in der Ausubung ihrer Funktion. 

Eine indirekte Repression (Drittes Modell) fiihrt YY1 uber die 
Rekrutierung von Corepressoren aus. Er nimmt indirekten Ein- 
fluE auf die Chromatinstruktur (49) . Von besonderem Interesse 
sind dabei die HDAC 1, 2 und 3, als Corepressoren. HDAC's ste- 
hen im Zusammenhang mit Auflockerung der Chromatinstruktur . 
Alle drei Proteine sind globale Regulatoren der RPD3, d.h. sie 
sind in der Lage, His tone zu deacetylieren (in vitro) . AuSer- 
dem konnen die HDAC bei Dirigation zum Promotor direkt die 
Transkription blockieren (48, 57-60) . Bei Uberexpression von 
HDAC 2 konnte durch die Gruppe Yang et al. (48) gezeigt wer- 
den, daS die Repressionsfunktion von YY1 verstarkt wird. Durch 
die Entdeckung, daiS HDAC 2 im Komplex mit HDAC 1 arbeitet, muS 
das gleiche auch fur HDAC 1 gelten. 

Akt i vi erungsmode lie 

Drei Modelle sind bekannt, wie Yin Yang die Transkription ak- 
tiviert (siehe Fig. 4) . Direkte Aktivierung konnte mit Hilfe 
des Adenovirus Protein E1A von der Gruppe Shi et al (61) ge- 
zeigt werden. Stimulation der Transkription wird erreicht 
durch die direkte Interaktion YY1 mit den GTF: TAFII55, TBP 
und TFIIB (62,63). Der zweite Mechanismus konnte am AAV P5 In- 
itiator Element aufgeklart werden (64) . Daruber hinaus wird 
diskutiert, ob YY1 eine strukturelle Veranderung durchmacht, 
wenn er mit anderen Proteinen interagiert. Im dritten Modell 
rekrutiert Yin Yang Coaktivatoren, die mit anderen Transkrip- 
tionsfaktoren interagieren. Dieses Modell beinhaltet viel- 
leicht auch die Modifikation des Chromatin durch p300. Durch 
die Auflockerung der Chromatinstruktur mittels p300 (HAT- 
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Aktivitat), ware der Zugang zur DNA erleichtert und eine effi- 
ziente Bindung moglich (51,55,65). 

Regulation von YY1 durch Acetylierung und Deacetylierungz 

Die Regulation des Transkriptionsfaktors erfolgt auf der post- 
translationalen Ebene durch die Interaktion mit anderen Pro- 
teinen. 

Die Transkriptionsaktivatoraktivitat von YY1 ist direkt abhan- 
gig von der Assoziation zu den Coaktivatoren p300, CBP, sowie 
PCAF. Diese Coaktivatoren besitzen Histon-Acetyl transferase 
(HAT) und sind somit befahigt, Acetylgruppen zu transf erieren. 
Ira Gegensatz dazu ist die Repressionsaktivitat von YY1 assozi- 
iert mit der Histon-Deacetylase2 (HDAC2) im Bereich 170-200 
der Repressionsdomane. 

Die selektive Assoziation von YY1 mit HAT oder HDAC entschei- 
det daruber, ob er als Aktivator oder Repressor fungiert. 

Acetylierung und Deacetylierung durch p3 00, PCAF und DHAC: 

Yin Yang verfugt uber 2 Acetylierungsdomanen. Die erste liegt 
im Bereich zwischen 170 bis 200, die Zweite iiberlappt den 
Zinkf ingerbereich am C-terminalen Ende zwischen 261-414. 

Die Acetyl ierungen im Bereich 170 bis 200 werden durch p300 
und PCAF an den Lysin- Resten durchgef uhrt . Sechs Paare an 
Lysinen befinden sich in der ersten Domane, wobei aber nur 3 
verschiedene Lysine durch p300 und PCAF acetyliert werden. Um 
eine maximale Repressionsaktivitat zu erhalten, muS YY1 an al- 
ien drei Stellen acetyliert werden. Wurde nur ein Lysin durch 
ein Arginin ersetzt werden, ware keine maximale Repress ions ak- 
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tivitat mehr gewahrleistet, aufgrund der eintretenden Konfor- 
mationsveranderung . 

Ein weiterer, entscheidender Punkt der Acetylierung zwischen 
170 bis 200 ist, daS sich die Bindungswahrscheinlichkeit von 
DHAC signifikant erhoht und somit in diesem Bereich auch eine 
Deacetyliemng durch HDAC 1,2 erfolgen kann. 

Erstaunlicherweise ist es HDAC auch moglich, in dem zweiten 
Acetylierungsbereich (261-333) zu binden. Im Gegensatz zur er- 
sten Acetylierungsdomane findet hier jedoch keine Deacetylie- 
mng statt. 

Weiterhin konnte gezeigt werden, daS sich durch die Acetylie- 
rung von PCAF im uberlappenden Bereich des Zinkfingers (261- 
333) die DNA-Bindungsaktivitat von YY1 erniedrigt (66) . 

Feinkartierung von YY1 

Da die Sequenz der Ratte bis Dezember 2002 noch nicht in der 
Genbank vorhanden war, wurde erf indungsgemaS die Gensequenz 
der Maus benutzt, um Primer zu rekrutieren, denn die erste 
Aufgabe bestand in der Feinkartierung von YY1 . Es muSte si- 
chergestellt werden, dafi das Gen tatsachlich im diabetespro- 
tektiven Bereich liegt. 

Da die Chance, im Intron einen Polymorphismus zu finden, recht 
grofi ist, wurden Primer zur Amplif ikation der Introns verwen- 
det (vgl. Fig. 11; Intron 1: K828-F/K829-R; Intron 2: K830- 
F/K832-R; Intron 3: K831-F/K833-R; Intron 4: K815-F/K817-R; 
K815-F/K875; K821-F/K817-R; K821-F/K870-R; K874-F/K870-R) . Es 
wurde nur ein sequenzierbares Genprodukt mit genomischer DNA 
vom Intron 4 erhalten. Das Intron hat 633 Basenpaare (bp) und 



WO 2004/056857 



PCT/EP2003/014762 



20 

unterscheidet sich zwischen BB- und SHR-Ratten an den Positio- 
nen 323 (t-a) , 502 (g-c) und 528 (a-c) . Zur genauen Positio- 
nierung von YY1 auf Chromosom 6q32 wurde dieser Polymorphismus 
unter Verwendung der subkongenen BB. 6S-Linien benutzt. YY1 
wurde zwischen D6Mgh2 und Ighe kartiert und befindet sich so- 
tnit im diabetesprotektiven Bereich. 

Dm zu priifen, ob der Polymorphismus im Intron 4 auch bei an- 
deren Stammen vorkommt Oder weitere Unterschiede auftreten 
konnen, wurde das Intron 4 von folgenden Ratten sequenziert 
und verglichen: 2 Wildf angtiere (Wildtyp, M+W) , jeweils 1 Tier 
von diabetes-resistenten, ingezuchteten DA/K, BN/Mol, LEW/K 
und WOKW-Ratten. 

WOKW-Ratten entwickeln keine Hyperglykamie (=Diabetes) , aber 
ein komplettes metabolisches Syndrom (Fettsucht, Hyperinsu- 
linamie, Dyslipidamie, gestorte Glukosetoleranz, Hypertonie) 
und stammen wie BB/OK-Ratten aus der gleichen Wistarratten- 
Auszuchtpopulation der BioBreeding Laboratories, Ottawa, Cana- 
da (67,68) . 

Im Ergebnis zeigte sich, daS die Intronsequenz zwischen BB/OK 
und Wildfangtieren, sowie zwischen SHR und DA, BN, LEW.1W, als 
auch WOKW identisch ist. 

Sequenzierung von YY1 

Sowohl genomische als auch cDNA wurde mittels PCR unter Ver- 
-wendung verschiedener Primer so amplif iziert, daS uberlappende 
Genprodukte zur Sequenzierung zur Verfugung standen (vgl. Fig. 
11; Promotor: K823-F/K825-R* ; Promotor und Exon 1: K884- 
F/K806-R; Exon 1: K801-F/K804-R; K814-F/K832-R* ; Exon 2 und 3: 
K828-F/K833-R; K831-F/K817-R; Exon 4: K815-F/K870-R; K815- 
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F/K818-R; K816-F/K819-R; K834-F/K836-R) . Die PCR und Sequen- 
zierung wurden wie im Material & Methoden-Teil (M&M) beschrie- 
ben durchgef uhrt . 

Das YYl-Gen der Ratte umfaSt 1236 Basenpaare (bp) und besteht 
aus 411 Aminosauren (AS) , was von Nishiyama et al. 2003 besta- 
tigt wurde (69) . Sequenzunterschiede zwischen BB/OK und SHR 
bzw. BB.6S wurden an Position 603 (c-t) , 980 (t-g) und 1004 
(g-a) nachgewiesen (vgl. SEQ ID NO:l und 3) . Dieser Basenaus- 
tausch fuhrt zur Anderung der Aminosauren an Position 303 und 
311 im Zinkf ingerbereich (vgl. SEQ ID NO: 2 und 4) . Bei BB/OK - 
Ratten kodieren die AS Methionin (Nukleotide 907-910 ab Start- 
codon) und Arginin (Nukleotide 931-933 ab Startcodon) und bei 
SHR-Ratten die AS Arginin und Lysin. 

Der Promotorbereich wurde nur teilweise vom Transkriptions- 
start (-72) sequenziert, wobei noch ein Bereich von 470 bp mit 
der GC-Box vorliegt. Unterschiede zwischen BB/OK und SHR waren 
nicht nachweisbar. 

Nach Sequenzvergleichen mit der Maus sollte der Promotorbe- 
reich ca. 891 bp vom Transkriptionsstart entfemt sein (Acc: 
L13969, 1-464, 86% Homologie) . Beim Vergleich mit der Humanse- 
quenz (Acc: AF047455 Promotor in dieser Sequenz nur -42bp) wa- 
ren Ubereinstimmungen zwischen -636 bis -585 (216-269; 47/54; 
87% Ubereinstimmung) und -464 bis -392 (392-464; 64/73; 87%) 
Basen vom Transkriptionsstart zu finden. 

Sequenzvergleich der Nukleinsaure und des Proteins zwischen 
Ratte und Mensch 

Der Sequenzvergleich zwischen BB/OK-, SHR-Ratte und Mensch, 
wie in Fig. 9 und 10 zusammengestellt, zeigten eine bp- 
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Ubereinstimmung von 95 # 6% bzw. 95,3% und die AS von 96,9 bzw. 
96,4%. Berucksichtigt man die Tatsache, daS der Ratte 3 AS 
fehlen (3 Histidine, 1 x zwischen Aktivierungs- und erster Re- 
presssionsdomane, Position 66 beim Menschen und 2 in der er- 
sten Repress ionsdomane, statt 12 Histidinen hat die Ratte nur 
10), erhoht sich die Ubereinstimmung im codierenden Bereich 
zwischen Ratte und Mensch bei den bp auf 97,0 (1206/1239) bzw. 
96,8% (1200/1239) und bei den AS auf 97,6% (401/411) bzw. 
97,1% (399/411). Im Zinkfinger, der 330 bp und 110 AS umfafit, 
stimmen bei der BB/OK-Ratte 99% der bp (327/330) und AS 
(109/110) und bei SHR-Ratten 98% der bp (325/330) und 97,3% 
(107/110) der AS uberein. 

Genexpressionsstudien 

Urn zu priifen, inwieweit die Sequenzunterschiede eine Auswir- 
kung auf die Genexpression von YY1 haben, wurden Genexpressi- 
onsstudien durchgef uhrt . 

Es wurde mRNA aus isolierten Langerhannschen Inseln, Pankreas, 
Leber, Gehirn, Thymus und Milz von 8 Tage alten Ratten der In- 
zuchtstamme BB/OK, SHR, BB. 6S und LEW („unbelastete" Kontrol- 
le) gewonnen, in ssDNA umgeschrieben und fur die Genexpressi- 
onsstudien eingesetzt (vgl. Material&Methoden-Teil) . 

Es wurde wiederholt gezeigt, daS der YYl-Zinkf ingerbereich un- 
ter Verwendung der Primer K831-F/K818-R und K831-F/K870-R in 
isolierten Langerhansschen Inseln der BB/OK-Ratte bzw. LEW- 
Ratte stark- (YYl-Zinkf inger/GPDH-Intensitat = 0.19 ± 0.04) und 
signifikant erniedrigt in den von SHR- und BB.6S-Ratten expri- 
miert ist (YYl-Zinkf inger/GPDH-Intensitat = 0.03 ± 0.02; 
p<0.001). Im Pankreas zeigte sich ein ahnlicher Expressionsun- 
terschied, jedoch etwas abgeschwacht . Die Dntersuchung der Ex- 
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pression unter Verwendung der Primer K831-F und K870-R zeigte, 
dafi im Pankreas, der Leber und im Gehirn bei BB.6S -Ratten eine 
zweite, urn ca. 150 bp kiirzere Bande auftrat, die weder bei 
BB/OK noch bei SHR und LEW zu beobachten war. Interessant war 
auch die Tatsache, daS Geschlechtsunterschiede in der Genex- 
pression auftrat en. Die Expression bei mannlichen Tieren war 
stets starker als bei Weibchen. In alien anderen untersuchten 
Organen wird YY1 exprimiert. Augenfallige Unterschiede zwi- 
schen den Stammen, auSer zwischen mannlichen und weiblichen 
Tieren, wurden nicht beobachtet. 

Sequenzierung der zweiten Bande bei BB. 63 

Da eine zweite Bande nur bei BB.6S-Ratten im Pankreas, in der 
Leber und im Gehirn auftrat, wurde diese zweite Bande eluiert, 
amplifiziert und sequenziert (vgl. M&M) • Im Ergebnis zeigte 
sich, daS diese Bande eine verkurzte Zinkf ingersequenz ist 
(vgl. Fig. 12 und SEQ ID NO: 7) . Danach fehlt ein Teil vom 
Zinkf inger 1, und Zinkf inger 2 fehlt vollstandig (967 bis 
1125; vgl. SEQ ID NO:8). 

Schlu&folgerungen 

Da gezeigt werden konnte, daS 

1. YY1 als multifunktioneller Transkriptionsfaktor im diabete- 
sprotektivem Bereich kartiert, 

2. Sequenzunterschiede mit Anderung der AS zwischen BB/OK und 
SHR im Zinkf ingerbereich (AS an Position 303 - Methio- 
nin/Aginin und 311 Arginin/Lysin sind different) und im 
Intron 4, das im Zinkf inger liegt, nachweisbar sind, 
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3 . bei BB/OK-Ratten YY1 in isolierten Langerhansschen Inseln 
und Pankreas deutlich und bei SHR- und BB.6S-Ratten kaum, in 
den anderen untersuchten Organen jedoch vergleichbar, aber 
mit 2 Banden bei BB.6S nach Amplif izierung des Zinkf ingerbe- 
reiches exprimiert ist, 

wurde der Schlufi gezogen, daS YY1 bei BB.6S in Langerhansschen 
Inseln unterexprimiert ist und darait diabetesprotektiv wirkt, 
wobei die zweite Bande im Pankreas und anderen Geweben eben- 
falls fur die Diabetesprotektion von Bedeutung ist, zumal dem 
Zinkfinger 2 eine besondere Rolle bei der Transkription zuge- 
sprochen wird. Eine Beobachtung, die durch die AS-Anderung im 
Zinkfingerbereich und/oder im Intron (unterschiedliches 
SpleiSverhalten bei BB/OK und BB.6S) verursacht ist. 

Da die Anderung im Zinkfingerbereich eine diabetesprotektive 
Wirkung hat, sind mehrere Gene in ihrer Regulation/Aktivitat 
beeintrachtigt/verandert . Fur eine Beteiligung des Introns an 
der Diabetesprotektion spricht die Tatsache, daS die Sequen- 
zunterschiede zwischen BB/OK und SHR nachweisbar waren, nicht 
aber zwischen BB/OK und Wildf angtieren. Die Sequenz zwischen 
BB/OK und Wildf angtieren war gleich. Dies wiederum erklart, 
warum BB.6S-, nicht aber BB.6W-Ratten vor der Entwicklung ei- 
nes Diabetes geschiitzt sind. 

Infolge der erf indungsgemaS gewonnenen Erkenntnisse eroffnet 
die Modulation des multifunktionellen Transkriptionsf aktors 
YY1 auf Expressions- und Regulationsebene zum einen erstmals 
einen Weg> urn Typ-1- Diabetes zu verhindern, zum anderen lassen 
sich durch diese Modulation auch Autoimmunerkrankungen als 
solche verhindern. Ferner lassen sich auch weitere Erkrankun- 
gen wie Krebs, AIDS, Fettstof fwechselstorungen und Hypertonie 
positiv beeinf lussen. 
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Gegenstand der vorliegenden Erfindung ist daher ein Protein, 
das die in SEQ ID NO: 4 dargestellte Aminosauresequenz auf- 
weist. Ferner eingeschlossen sind Homologe des Proteins, die 
Arginin und an Position 311 Lysin aufweist. Der Homologiegrad 
betragt mindestens 95%, vorzugsweise mindestens 97%, und be- 
sonders bevorzugt mindestens 99%. 

Die Erfindung betrifft auch Peptide, die Fragmente eines vor- 
genannten Proteins sind und eine Aminosauresequenz aufweisen, 
die den die Aminosaurepositionen 303 und 311 in SEQ ID NO: 4 
(bzw. 306 und 314 in SEQ ID NO: 6) umfassenden Sequenzbereich 
enthalt. Die Lange der erf indungsgemaSen Peptide betragt bei- 
spielsweise 53 bis 315 Aminosauren, vorzugsweise z.B. 315, 117 
oder 53 Aminosauren, wobei die Peptide vorzugsweise die Se-; 
quenzbereiche von Position 1 bis 315, von 295 bis 411 bzw. von 
299 bis 351 umfassen. 

ErfindungsgemaS sind ferner folgende Fragmente wichtig: Ami- 
nosauren 165-214; 255-333; 255-411. Die Numerierung bezieht 
sich auf die Numerierung gemafi SEQ ID NO: 4. 

GemaS einer bevorzugten Ausfuhrungsform der Erfindung sind 
auch Peptide von Bedeutung, die nur einen Bereich von z.B. Po- 
sition 295-310 Oder 305-320 (Numerierung bezogen auf SEQ ID 
NO: 4) abdecken und somit nur eine der beiden mutierten Ami- 
nosauren einschlieSen. 

Die Erfindung betrifft ferner eine Nukleinsaure, die fur ein 
vorgenanntes Protein oder Peptid kodiert. Die fur das Protein 
mit der in SEQ ID NO: 4 kodierende Nukleinsaure weist vorzugs- 
weise die in SEQ ID NO: 3 dargestellte Nukleinsauresequenz auf. 
Eine fur die vorgenannten Homologen kodierende Nukleinsaure 
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weist eine Nukleinsauresequenz auf, die den die NukleinsSure- 
positionen 979-981 und 1003-1005 in SEQ ID NO: 3 umfassenden 
Sequenzbereich enthalt. Die Codons an den genannten Positionen 
konnen selbstverstandlich infolge der Degeneration des genet i- 
schen Codes variieren, solange sie fur die Aminosauren Arginin 
bzw. Lysin kodieren. 

ErfindungsgemaS ist ferner die Intronsequenz wichtig: 1126- 
1758. (Die Lage der Exons in SEQ ID NO: 3 ist: Exon 1:73 bis 
729; Exon 2: 730 bis 825; Exon 3: 826 bis 978; Exon 4: 979 bis 
1125; Exon 5: 1759 bis 1938; siehe Sequenprotokoll . ) Die Nume- 
rierung bezieht sich auf die Numerierung gemaS SEQ ID NO: 3. 

Diabetes Mellitus Typ 1 und Autoimmunerkrankungen an sich 

Wie bereits erwahnt, resultiert Typ- 1 -Diabetes aus der selek- 
tiven Zerstorung der Insulin-produzierenden p-Zellen im Pankre- 
as. Der Untergang der P-Zellen wird durch autoreaktive T- 
Zellen, die gegen p-Zell-spezif ische Antigene (Autoantigene) 
gerichtet sind, gesteuert . Mit der Diabetesmanifestation ver- 
bunden ist eine Insulitis (69) . Dieser Prozess ist gekenn- 
zeichnet durch die lymphozytare Infiltration der p -Zelle. Da 
eine Insulitis nicht immer die Antwort auf eine p- 
Zelldestniktion sein muB, unterscheidet man zwischen einer be- 
nignen und destruktiven Insulitis (70) . Dieser ProzeS korre- 
liert mit der Cytokinproduktion, wie fur Modelltiere (BB- 
Ratte) und fur den Menschen gezeigt werden konnte (71-78) . Da- 
bei spielen die Cytokine IPNy und IFNa wahrend der destruktiver 
Insulitis eine Hauptrolle. Fur die benigne Insulitis werden 
IL10 und ?GFp als Hauptfaktoren angesehen, Daruber hinaus konn- 
te in nicht-diabetischen Mausen Insulitis durch TNFa, TNFp, so- 
wie IL6 induziert werden, was jedoch nicht zu einer p- 
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Zellzerstdrung fuhrte. Bei transgener Egression von IFNa, IFNy 
und IL2 konnte gezeigt werden, dafi nicht-diabetische Mause ei- 
ne Insulitis und einen autoimmunen Typ-l-Diabetes entwickeln. 
Demnach sind IFNy, IFNa, IL2 und IL10 bei der Entstehung, TNFa, 
IL4, IL6, sowie TGFp bei der Verhinderung des Typ-l-Diabetes 
involviert (71-81) . 

Da alle BB.6S-Ratten eine Insulitis entwickeln, Diabetes aber 
nur bei etwa 15% der Tiere auftritt (82), mu£ YY1 auch beim 
InsulitisprozeS eine Rolle spielen. Entweder schaltet YY1 die 
protektiven Cytokine an, unterdruckt die pathogenen Cytokine 
oder er balanciert beide Cytokingruppen so, daS zum einen die 
p-zelldestruktive Insulitis auftritt oder aber die benigne In- 
sulitis, die nicht zum autoimmunen Diabetes fuhrt, zum Tragen 
kommt. Da er auch in der Lage ist, IL4 zu aktivieren (83) und 
IFNy zu inhibieren (84) , wird erf indungsgemaE davon ausgegan- 
gen, da£ er auch die Relation der T-Helf erzellpopulationen, 
TH1 und TH2, zugunsten von TH2 verschiebt. 

Ist durch eine Mutation die AS-Sequenz von YY1 bei Typ-1- 
Diabetikern verandert, kann er nicht mehr an bestimmte Sequen- 
zen in der DNA binden, oder aber seine Affinitat zur Bindungs- 
stelle ist reduziert. D.h., er kann nicht mehr an den IFNy- 
Promotor binden, oder mit zu niedriger Affinitat, vmd die IFNy- 
Synthese auch nicht mehr hemmen. Eine Uberproduktion von IFNy 
ware die Folge. Diese Uberproduktion konnte dann zu einer In- 
sulitis fuhren. Da IFNy die TH1 Antwort aktiviert, indem er die 
MHC-Klasse-I-Proteine auf der Oberflache von p-Zellen hochregu- 
liert (85,86) und sogleich die T-Zelldif ferenzienmg in Rich- 
tung TH1 beeinflufit und dadvirch die TH2 -Antwort reduziert, wa- 
re eine Verschiebung zwischen TH1 und TH2 gegeben, wie es beim 
autoimmunen Diabetes postuliert wird. Daruber hinaus ist be- 
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kannt, daS Makrophagen zuerst in der p-Zelle nachweisbar sind. 
Da IFNy ein Stimulator fur Makrophagen ist, kann die friihe Ein- 
wanderung in die P-Zelle dadurch erklart werden, daS IFNy nicht 
mehr durch YY1 gehenunt wird. Zusatzlich ist YY1 auch pradesti- 
niert, die IL4 Synthese einzuleiten (83) . Ist dieser Fakt 
durch Sequenzveranderung Oder Unterproduktion von YY1 auch 
nicht gegeben, kann die THl-Antwort nicht mehr durch IL4 als 
protektives Cytokin unterdruckt werden. Aufgrund einer erhoh- 
ten Aktivitat von TH1 konnen cytotoxische T-Zellen (CTL Oder 
CD8 + ) und NK-Zellen ihre Funktion in der p-Zelle als „Killer 
Zellen u wahrnehmen. Der apoptotische p-Zelltod, induziert durch 
FAS-Rezeptoren unter Interaktion mit dem FAS-Liganden, kann 
durch YY1 auch zusatzlich noch induziert werden (87) . Ist der 
Transkriptionsfaktor bei Typ-1 -Diabetikern mutiert, kann er 
nicht mehr in vollem MaSe die FAS -Express ion hemmen. Somit er- 
scheint FAS auf der Oberflache von p-Zellen, und die apoptoti- 
sche Signalkaskade ist aktiviert. Das Resultat ist der p- 
Zelltod und damit Typ-1 -Diabetes. 

Da neonatale Thymektomie bei Modelltieren (BB-Ratte und NOD- 
Maus) die Entstehung eines Typ-1 -Diabetes verhindert (88), 
wird u.a. auch vermutet, daS beim Typ-1 -Diabetes autoreaktive 
T-Zellen schon wahrend der T-Zelldif f erenzierung entstehen. 
D.h., YY1 mufite schon in einem fruhen Stadium der T- 
Zellentwicklung eingreifen, was man sich wie folgt vorstellen 
konnte : 

Urn ein . fxmktionales Lymphozytenrepertoire zu entwickeln, miis- 
sen die Vorlauf erzellen, sogenannte Prathymozyten, verschie- 
denste Entwicklungsstadien im Thymus durchlaufen. Da nur etwa 
2% reifer T-Zellen den Thymus verlassen konnen, liegt eine 
strenge Selektion wahrend der T-Zellreifung vor, welche uber 
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Tod oder tiberleben entscheidet • Ein Regulationspunkt ist im 
friihen Thymozytenstadium, dem „Doppelt Negativen w (DN) , veran- 
kert. Hier entscheidet der auf der Oberflache befindliche pra- 
T-Zell-Rezeptor (preTCR) , bestehend aus CD44 (p-Kette) und der 
invarianten Kette pTot, ob ein Eintreten in den Zellzyklus mog- 
lich ist. Dieser Kontrollpunkt wird auch als „Beta-Checkpoint w 
bezeichnet. Die unreifen T-Zellen verweilen solange in diesem 
Stadium, bis das richtige ct-Ketten-Gen umgeordnet ist und der 
T-Zell-Rezeptor (TCR) , bestehend aus a- und p-Kette, auf der 
Oberflache exprimiert werden kann. Erscheinen beide T-Zell- 
Rezeptoreh CD4 plus CD 8 zusammen mit CD3 auf der Oberflache, 
werden die's e T-Zellen nun als „Doppelt Positiv" (DP) bezeich- 
net. Etwa 95% erreichen dieses Stadium nicht. Dies unter- 
streicht die Bedeutung des Kontrollpunktes beim Ubergang vom 
DN- zum DP-Stadium (89) . 

Als kritischer Gesichtspunkt wird dabei die Regulation der Ex- 
pression der pTa-Kette betrachtet. Die pTa- Gent ranskript ion 
scheint bisher vorallem durch den upstream Bereich, dem Enhan- 
cer, entscheidend reguliert zu werden. Mehrere Proteine, unter 
ihnen befindet sich auch YY1, die in der Lage sind, an diesen 
Bereich zu binden, wurden identif iziert (90) . Als weitere Bin- 
dungsproteine des Enhancer sind zu nennen: SP1/3, ZBP-89 und 
c-MYC. Betrachtet man diese Proteine im Zusammenhang mit YY1, 
kann man schluSf olgern, daS alle, ausgenommen ZBP-89, mit YY1 
interagieren, so daS als weiterer Regulationspunkt von YY1 
auch die T-Zellreifung angesehen wird. Unterstutzt wird diese 
Annahme durch Befunde von Iritani et. al. (91). Sie konnten 
zeigen, daS c-MYC allein nicht in der Lage ist, die pTa- 
Expression zu regulieren. Nur verschiedenste c-MYC Konzentra- 
tionen schienen zum Teil einen Einflufi auf den Zellwachstum- 
sarrest itn spaten DP-Stadium zu haben, Ist YY1 im Thymus 



WO 2004/056857 



PCTYEP2003/014762 



30 

uberexprimiert , schaltet er die Transkription pTa an. In umge- 
kehrter Weise, bei Unterexpression, verhindert er die pTa- 
Transkription. Bei tiberexpression oder Unterexpression, sowie 
Sequenzveranderungen von YY1 k6nnen T-Zellen wahrend ihrer 
Entwicklung in den Arrest geschickt oder aber in ein weiteres 
T-Zellstadium uberfuhrt werden. 

Da die T-Zellreifung und deren Selektion bei alien Autoim- 
munerkrankungen, wie Rheumatoide Arthritis, Multiple Sklerose, 
Autoimmune Encephalomyelitis, Zoliakie u.a., entscheidend ist, 
konnen neben dem Typ-1 -Diabetes auch Autoimmunerkraiikungen 
per se durch YY1 beeinfluSt werden, was durch Auf- oder Abre- 
gulation von YY1 erreicht wird. 

Es wird davon ausgegangen, daE sich die YYl-Sequenz zwischen 
Typ-l-Diabetiker und gesunden Probanden unterscheidet . Mehrere 
Sequenzvarianten werden fur Typ-l-Diabetiker erwartet, da es 
neben dem klassischen Typ-l-Diabetiker auch noch weitere For- 
men fur Typ-1 -Diabetes existieren, wie zum Beispiel der LADA 
(Latent Autoimmune Diabetes in Adults) . Diese Sequenzvarian- 
ten sollen als genetischer Marker fur die Pradiabetiker ge- 
nutzt werden. Der Nachweis der Anderung basiert auf der DNA- 
Sequenzierung, wobei Vollblut gewonnen, DNA bzw. UNA, die um- 
geschrieben wird in ssDNA, isoliert und dann sequenziert wird. 

Parallel dazu wird das Expressionsprof il fur Typ-l-Diabetiker 
erstellt. In Anbetracht der Tatsache, da£ die Krankheit eines 
jeden Typ-1 -Diabetikers individuell verlauft, wird erwartet, 
daS das Expressionsprof il von Proband zu Proband unterschied- 
lich ist. In Abhangigkeit vom Alter des Probanden, vom Ge- 
schlecht, vom Autoantikorperstatus [GAD (Glutamatdecarboxyla- 
se) , IA-2 (Proteintyrosinphosphatase) , ICA (zytoplasmatische 
Inselzellautoantikorper)] vom BMI, sowie vom HLA-Genotyp (HLA- 
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DQB1) werden unterschiedliche Express ionsprof ile erwartet. 
Demnach soli eine entsprechende Prophylaxe/Therapie auch indi- 
viduell zugeschnitten werden, Durch die genetische Heterogeni- 
tat interagiert YY1 bei jedem Individuum mit einem differenten 
genetischen Hintergrurid, so daS die YYl-Expression zwischen 
den Individuen groSen Schwankungen unterliegen wird. 

Eine Abregulation kann iiber Applikation von Antisense und 
durch Herstellung spezifischer Antikorper fur den jeweiligen 
Probanden erreicht werden. Die Struktur der Antisense und der 
Antikorper ergibt sich aus der Sequenzfolge des Probanden. Die 
zu applizierende Menge der Antisense sowie Antikorper ergibt 
sich aus dem Expressionsprof il des Probanden (Auf- und Abregu- 
lation vgl. M&M) . 

DaS YY1 selbst als Autoantigen fungiert, liegt nahe, weil bis 
dato das auslosende Autoantigen fur die Zerstorung der Insu- 
lin-produzierenden Beta-Zelle immer noch nicht bekannt ist. 
Liegt eine Bestatigung vor, daS YY1 als Autoantigen fungiert, 
soil uber orale Verabreichung von YY1 Toleranz induziert wer- 
den, wie es bei Allergikern durch Hypersensibilisierung be- 
reits erfolgt. Dabei soli fur den jeweiligen Probanden oder 
Probandengruppen die Sequenzvarianten erfaSt und anschlieSend 
die mutierte Form synthetisch hergestellt werden, um es oral 
verabreichen zu konnen. Damit soil eine Verschiebung des 
TH1/TH2 Profils erreicht werden, tun der autoimmunen Zerstorung 
entgegenzuwirken . 

DaS durch Applikation von nackter cDNA oder DNA die Entstehung 
eines Typ-1 -Diabetes bei BB/OK-Ratten verringert werden kann, 
zeigteh juiigste Ergebnisse einer Pilotstudie. 174 Nachkommen 
nicht -diabetischer Muttertiere wurde mit 2, 8, 12, 16, 20, 25 
und 30 Tagen nackte DNA der Primer K815 und K817, K831 und 
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K818 (Figur 11) sowie gereinigte PCR-Produkte unter Verwendung 
der Primer K815 und K817 (Amplif ikation genomischer BB/OK-DNA, 
Intron von YY1, Sequenz 1069 bis 1804) sowie K831 und K870 
(Amplif ikation von BB/OK-cDNA, Exon 3, 4 und 5, Zinkfinger, 
Sequenz 911 bis 1125 und 1758- bis 2078) dosisabhangig (100, 
200 und 400 ng in 50 fil) einmal an den o.g. Tagen s.c. appli- 
ziert. Dariiber hinaus wurden nicht-diabetische BB/OK-Weibchen 
gezielt angepaart, die bei Spermanachweis and dann am 4., 8., 
12., 16. und 18 Schwangerschaf tstag mit 100 oder 400 ng nack- 
ter DNA (Primer K815/K817) behandelt wurden. Die 24 Nachkom- 
men dieser Mutter und die 174 post-partuum behandelten Nach- 
kommen wurden bis zur 30. Lebenswoche auf Diabetesvorkommen 
beobachtet. Als Kontrolle dienten unbehandelte sowie behandel- 
te BB/OK-Ratten, denen 50 pi Wasser s.c. im gleichen Alter 
appliziert wurde. Nach 30 Wochen waren 93% der behandelten 
(13/14) und 86% der unbehandelten Kontrolltiere (19/22) er- 
krankt. Eine recht deutliche Senkung der Diabeteshauf igkeit 
wurde in 2 Versuchsgruppen beobachtet. Die Hauf igkeit sank auf 
62% (8/13) bei Applikation des Zinkf inger-PCR-Produktes (400 
ng) und auf 50% (6/12) bei den Nachkommen, die von dem mit 
400ng behandelten Muttertier geboren wurden; Alle ubrigen Ver- 
suchsgruppen erkrankten mit den der Kontrollgruppen vergleich- 
baren Hauf igkeit (74 bis 100%) , wobei eine Dosisabhangigkeit 
zu beobachten war. Eine weitere Studie zeigte, dass die Appli-. 
kation von 400ng/50/zl PCR-Produkt, amplif iziert mit den Pri- 
mern K831/K870 die Diabetesinzidenz weiter senken konnte. Im 
Vergleich zur /# Wasserkontrolle u (16/19=84%) erkrankten signi- 
fikant weniger BB/OK-Ratten (16/19 vs. 13/27; p=0.013)der be- 
handelten Gruppe . ■ Ange si chts dieser ersten Ergebnisse wird da- 
von ausgegangen, daS durch eine haufigere und/oder langere Ap- 
plikatioii nackter DNA und/oder PCR-Produkten eine Senkung der 
Diabeteshaufigkeit bei BB/OK-Ratten gegen 0% erreicht werden 
kann. 
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Protoonkogene und Krebs 

Das c-MYC Gen wurde ursprunglich als zellulares Homolog des 
retroviralen v-myc Onkogens in den 70er Jahren entdeckt. Em- 
bryonale Lethalitat ist das Ergebnis einer Deletion dieses 
Gens. Das Produkt eines c-MYC Protoonkogens ist das c-MYC 
Protein, welches - ebenso wie YY1- einen multifunktioneller 
Transkriptionsfaktor darstellt. Eine entscheidende Rolle 
spielt c-MYC in der Dif f erenzierung, dem Zellwachstum, Pro- 
liferation, Transformation und Apoptosis von Zellen. Die 
Dysregulationen der c-MYC Expression stehen im Zusammenhang 
mit abnormen malignen Zellwachstum und somit der Tuniorentste- 
hung von Lutigenkrebs , Brustkrebs und Darmkrebs. Dies zeigt, 
dafi c-MYCi als starker Regulator des Zellwachstums, der Zell- 
differenzierung und Zellprolif eration ebenso stark kontrol- 
liert wie balanciert werden muS, urn die Carzinomentstehung zu 
verhindern (102-104) . 

Da YY1 als vielseitiger Regulator in Abwesenheit von dem es- 
sentiellen Partnerprotein (MAX) direkt an den C-terminalen 
Teil des basischen Helix-Loop-Helix (bHLH) Zinkfingers von c- 
MYC binden kanii, spielt YY1 auch bei der Krebsentstehung eine 
bedeutende Rolle. Hierbei ist YY1 in der Lage, jeden seiner 
vier Zinkfinger dazu zu benutzen, urn an das c-MYC Protein zu 
binden, Nicht moglich ist es YY1 jedoch, die Verbindung zwi- 
schen dem Komplex von c-MYC/MAX zu unterbrechen. Da aber trotz 
Komplexbildung zwischen YY1 und c-MYC die sequenzspezif ische 
DNA-Bindung von YY1 nicht blockiert wird, ist die Regulation 
auf DNA-Ebene durch YY1. immer noch moglich. 

Das humanfe c-MYC Gen kodiert zwei Polypeptide (439 und 453 
Aminosaureh) mit einem Mo leku large wicht von 64 und 67 kDa und 
ist im Zellkerh lokalisiert. Der Translationsstart des groSe- 
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ren Proteins liegt am Ende des ersten Exons, wahrend die klei- 
nere und meist vorherrschende Form des Proteins durch Transla- 
tion im zweiten Exon initiiert wird. 

C-MYC ist ein Transkriptionsf aktor, der basische Helix-Loop- 
Helix/Leuz in- Zipper Domane (bHLH-LZ) aufweist/ wobei diese 
konservierten Domanen Bestandteil vieler Transkriptionsfakto- 
ren sind -and Protein/ Protein, sowie Protein/DNA-Interaktionen 
vermitteLru 

C-MYC ist Teil eiiier Genfamilie, die noch weitere Mitglieder 
wie N-, L-, S- und B-myc beinhaltet (105-108). 

Die Bindung von c-MYC an die DNA erfolgt uber die sogenannte 
E-Box, eine spezifische regulatorische Sequenz der Basen 5'- 
CACGTG-3'. Zur Aktivierung der Transkription mufi das c-MYC 
Protein mit dem Partnerprotein MAX heterodimere Komplexe aus- 
bilden (109) . MAX gehort ebenfalls zu den bHLH-LZ Proteinen, 
besitzt aber keine transaktivierende Domane wie c-MYC (110) . 
Die Heterodimerisierung mit MAX ist essentiell fur die Funk- 
tionen von c-MYC/ wie Regulation des Zellzyklus # Einleiten von 
Apoptose Oder Transformation von Zellen. MAX bildet weiterhin 
mit den bHLH-LZ Proteinen der MAD-Familie Komplexe. Diese He- 
terodimere binden ebenfalls spezifisch an E-Boxen und wirken 
transkriptionsreprimierend uber Sin3 - vermittelte Rekrutierung 
von Histondeacetylasen (111) . 

Demnach sollte durch Ab- oder auch Auf regulation von YY1, be- 
dingt . durch seine -vielf altigen Interaktionen mit anderen Ge- 
nen, auch liber c-MYC, eine Beeinf lussung der Krebsentstehung 
moglich sein, was durch folgende Beobachtungen unterstrichen 
wird. 
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BB/OK-Ratten entwickeln nicht nur einen Typ-1 -Diabetes sonder 
auch Tumore wie eine Langzeitstudie zeigte. 202 BB/OK-Ratten 
wurden bis zu ihrem natiirlichen Tod beobachtet . 87 von den 202 
wurden diabetisch. Die verbleibenden 115 Tiere uberlebten im 
Mittel 576 ± 79 Tage. Nur 37% (42/115) wurden alter als 400 Ta- 
ge. Die Mehrzahl der Tiere (73/115) starb zwischen dera 200. 
und 400. Lebenstaig vornhemlich an Tumoren (50/115). Betroffen 
waren Leber, Lyphknoten, Lunge, Darm, Pankreas und Milz (112) . 
Analog wurde eine Studie mit BB.6S-Ratten durchgef tihrt . 47 
Tiere wurden bis zum 600. Lebenstag beobachtet. 6 von 47 Rat- 
ten (12,8%) wurden bis zur 30. Lebenswoche diabetisch, 2 wei- 
tere Tiere trianif eistierten im Alter von 437 und 560 Tag. 62% 
der Tiere (24 von 39 nichtdiabetischen Tieren) uberlebten den 
Beobachtungszeitraum von 600 Tagen. 6 Tiere starben, ohne ma- 
kroskopisch eine Todesursache feststellen zu konnen. 9 Tiere 
muSten auf Grund ihres schlechten Allgemeinzustandes getotet 
werden, wobei als Todesursache in 7 Fallen DarmverschluE und 
bei 2 Tieren Tumore in der Leber diagnostiziert wurden. Dem- 
nach uberleben die kongenen BB.6S-Ratten signifikant langer 
als BB/OK-Ratten \ind die Tumorrate ist signifikant niedriger 
bei BB. 6S als bei BB/0K (50/115 vs. 2/39, p<0.0001). Ange- 
sichts dieser Befunde, scheint die ausgetauschte Region und 
damit YY1 bei BB * 6S-Ratten die Tumorentstehung deutlich zu . 
senken lind die Lebehserwartung zu erhohen. Demnach sollte 
durch Abregulation von YY1 die Tumorentstehung verhindert und 
die Lebenserwartung gesteigert werden konnen. 

Lipids tof fwechsel 

Steroidhomorisyhthese 

Steroide werden in spezialisierten Zellen der Nebennieren, Ei- 
zellen, Hoden, Pla[centa und im Gehirn synthetisiert . Sie sind 
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essentiell fur die Auf rechterhaltung der normalen Korper- 
homoostase. Die Synthese aller Steroidhormone beginnt mit der 
Umwandlung von Cholesterol in Pregnenolon. Dies ist der erste 
enzymatische Schritt, der an der Matrix der innermitochondria- 
len Membran erfolgt. 

Das Steroidogenic Acute Regulatory Protein (StAR) spielt eine 
Schlusselrolle irn Transport von Cholesterol von der aufieren 
zur innermitochondrialen Membran, Dieser Transport ist der ra- 
tenlimitierende Schritt in der Steroidogenese. Mutationen im 
StAR-Gen verursachen die potentiell lethalen Bedingungen, die 
als congenital lipoid adrenale Hyperplasie bekannt sind. Glei- 
che Beobachturigeri konriten an S t AR- Knock - out Mausen gemacht 
werden (131) . 

StAR -Express ion kann durch Agenzien positiv und negativ regu- 
liert werden, die vorwiegend am Promoter wirken. Die hormon- 
stimulierte Steroidsynthese ist begleitet von einem schnellen 
Anstieg der StAR-mRNA- Spiegel . cAMP hat einen positiven und 
schnellen Effekt auf den Anstieg der StAR-mRNA, scheint aber 
nicht direkt ain der Promoters equenz zu wirken. 

Der erste Transkriptionsfaktor als potentieller Regulator des 
StAR-Gens war der Steroidogenic factor 1 (SF 1) , auch Orphan 
Nuclear Rezeptor Transkriptionsfaktor genannt. 

Der StAR-Promotbr besitzt verschiedene Consensus- 
Bindungssequenzen fxir SF 1. Zwei von diesen an Position -97 
und -42 sind hoch kortserviert . Eine weitere an Position -132 
wurde nur in Mausen und Ratten gefunden. 

Ein weiterer Karididat ist das CCAAT/ enhancer Bindungsproteine 
(C/EBPs) , das zur Familie der bRegion/leucine zipper Tran- 
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skriptionsfaktoren gehort. Zwei Mitglieder dieser Familie wer- 
den in steroidogeiien Zellen exprimiert (C/EMPa und C/EMPp) . 
Der StAR-Promotor hat zwei mdgliche Bindungssstellen fur 
C/EMP. SF 1 und C/EMP bilden einen Komplex am StAR-Promotor. 

Sowohl der humane als auch der Ratten- StAR-Promotor besitzt 
weiterhin Bindungsstellen fur SREBP-la (Sterol regulatory ele- 
ment binding protein- la) . SREBP-la ist ein bedeutender Aktiva- 
tor fur den StAR-Promotor. 

Weitere Transkriptionsfaktoren wie SF 1, NF-Y, YY1, und SP1 
sind in die Wirkun^. von SREBP am StAR-Promotor involviert. 
SREBP-la reguliert koordinierend zusammen mit den anderen Fak- 
toren den StAR-Promotor. 

CREB kaiiri ebeiifalls binden und auf schnelle Weise die Tran- 
skription aktivieren (cAMP Bindung) . 

DAX-1 biridet direkt an der Hairpin- Struktur des StAR-Promotors 
sowie direkt an SF-1 und inhibiert in beiden Fallen deren Ex- 
pression (131) . 

Wenn SREBP-la eiiie koordiriierende Rolle in der Bereitstellung 
von Cholesterol in der Steroidhormonsynthese ubernimmt, kommt 
ihm eine essentielle Bedeutung in der Oiolesterolhomoostase 
zu. Der' StAR-Promotor der Ratte besitzt 5 sogenannte SRE- 
Bindungsstellen (Sterol Regulatory Element) , an die die akti- 
vierte Form von SREBP-la binden und die Transkription aktivie- 
ten kann (132). Eine weitere SRE-Bindungsstelle wurde im" huma- 
nen StAR-Promotor gefunden, an die sowohl SREBP-la als auch 
YY1 binden karih und bedingungsabhangig bei hohen Konzentratio- 
nen von SREBP-la aktiv ist (133) . 
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SREBPs gehoren zur Familie der basic helix- loop-helix leucine 
zipper (bHLH-Zip) Transkriptionsfaktoren, die als 125 kDa mem- 
brangebundene Precursor-Proteine im endoplasmatischen Retiku- 
lum synthetisiert werden und bei Sterolmangel in der Zelle 
durch enzymatische Abspaltung der 68 kDa N-terminalen, die 
bHLH-Zip Domane enthaltenden Region des Proteins aktiviert 
werden und in den Nucleus einwandern. Dort binden sie spezi- 
fisch an die DNA-Sequenz von SRE (sterol regulatory element) 
und aktivieren die Transkription ihrer Zielgene (134, 135) . 

Es wurden bisher drei SREBPs beschrieben, die SREBP-la, SREBP- 
lc und SREBP-2 genannt werden. SREBP-la und -lc werden vom 
gleichen Gen unter Nutzung alternativer Promotoren exprimiert. 
SREBP-2 wird von einem separaten Gen exprimiert (135, 136) . 

Cholestolgerie, die klassische SRE-Bindungsstellen in ihren 
Promotoren besitzen, werden stark und ef fektiv von SREBP-la 
und SREBP-2 aktiviert. SREBP-lc ist inaktiv fur diese Bin- 
dungsstellen. 

SREBP-lc, auch ADD 1 genannt, weist eine Besonderheit auf. Es 
bindet ail E-Boxen (universelle cis-Elemente fur bHLH- 
Proteine) . Damit weist es eine duale Bindungsspezif itat zu 
beiden, den klassischen palindromen E-Boxen und den nonpa- 
lindromen SREs, aiif. Diese einmalige Bindungsspezif itat ist 
auf den Thyrosinrest in der basischen Region zuruckzufuhren, 
der einmalig fur die SREBP-Familie ist, denn alle bekannten 
bHLH-Proteine besitzen an dieser Position Arginin (136) . Die- 
ser Austausch zerstdrt die Transaktivitat aller SREBPs fur 
SRE-Bindungsstellen, erhoht aber markant die Aktivitat von 
SREBP-1 fur Mndung ah E-Boxen (siehe SREBP-lc) aber auch von 
SREBP-2. Dieses ist jedoch inaktiv und aktiviert das Zielgen 
nicht (136) . 
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Die SREBPs sind unterschiedlich starke Transkriptionsfaktoren 
und benotigen meist Cofaktoren. Solche sind NF-Y, SP1, CBP 
(CREB-Bindungsprotein) . 

SREBP-Zielgene werden in 2 Gruppen eingeteilt (136) : 

• Cholesterol -Biosyhthese-Gene 

• HMG-CoA- synthase und -reduktase 

• Farnesyl -diphosphat synthase 

• S qua lensynthas e 

• SREBP-2 

• LDL-Rezeptor' . 

• HDL-Rezeptor (137) 

Alle erithalten die klassische SRE-Sequenz (ATCACCCCAC) 
Oder das SRE 3 Motif (CTCACACGAG) und angrenzende Cofak- 
tor-Bindungsstellen fur NF-Y oder SP1 in ihren Promotoren. 

• . Lipogene Enzym-Gene 

Sind nahrungsreguliert auf der Transkriptionsebene 
( z . B . Glukose , Insulin) 

• Acetyl -CoA- Carboxylase 

• Fettsauresynthase (FAS, erhoht TG) 

• Steryl- CoAdesaturase 1 und 2 

• Glycerol-3 -phosphat-Acyl transferase 

• Diacepam-binding Inhibitor (Acyl-CoA-Bindungsprotein) 

• Spot 14 (Leberenzym S 14) 

Die SREBP-Bindungs- und -Aktivierungsstellen in den Pro- 
motoren dieser Gene scheinen sich von den klassischen 
Si^-Consensug-Seqiienzen zu unterscheiden und werden als 
SRE - like - Secjtienzen bezeichnet. 
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Einige weitere Enzyme wie Liver- Type -Pyruvatkinase (PK) und 
Glukokinase (GK) enthalten E-Box oder E-Box-like Sequenzen im 
Promotor, was bedeuten kann, daS sie Kohlenhydrat , Glukose- 
und Insulin- sens itiv sind und potentiell SREBP-Targets sein 
konnen. 

Alle aktiv wachsenden Zellkulturen produzierten predominant 
SREBP-la und SREBP-2, wogegen die meisten Organe einschlieS- 
lich Leber von adulten Tieren SREBP-lc und SREBP-2 produzie- 
ren. Alle SREBPs sind in der Lage, jedes der bekannten Zielge- 
ne zu aktivieren, jedoch mit unterschiedlicher Effizienz. 
SREBP-lc ist schwacher (kiirzere Transaktivierungsdomane) als 
SREBP-la und SREBP-2. 

Die spezifische Rolle der SREBP-Isoformen in vivo wurde in 
transgenen Mausen untersucht Die differente Uberexpression er- 
gab, daS die SREBP-l-Isof ormen selektiv die Fettsaurebiosyn- 
thesegene aktiviereii und SERBP-2 spezifisch die Cholesterol- 
biosynthese kontrolliert. 

SREBP-la und -lc spielen eine groSe Rolle in der nahrungsab- 
hangigen Induction hepatisch lipogener Enzyme und der Chole- 
sterogenese. SREBP-2 dagegen bestimmt die Sterolregulation 
durch Abbau des membrangebundenen Precursor- Proteins, urn die 
aktive Form fur die Einwanderung in den Nukleus bereitzustel- 
len. SREBP-1 kontrolliert lipogene Enzyme durch Selbstregula- 
tion seines eigenen Transkriptionslevels. 

Der Fakt, daS die SREBPs relativ schwache Transkript ions fakt o- 
ren sind und Cbfaktoiren benotigen, wurde bereits erwahnt. Ben- 
nett et.al.(138) zeigten beispielsweise, daS die Aktivierung 
der SREBPs durch Sterblmangel in vivo in einer erhohten Bin- 
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dung von SP1 an einer, an die SREBP-Bindungsstelle angrenzen- 
den Sequenz im Promotor fur das LDL-Rezeptorgen bindet. Ahn- 
lich werden die zwei coregulierenden Faktoren NF-Y und CREB 
(cAMP Responsive Element Binding Protein) verstarkt an den 
Promotor von HMG CoA-Reduktase gebunden. SREBP-Aktivierung er- 
h6ht die Histonacetylierung von H 3, nicht aber von H 4 im 
Chromatin beider Promotoren ( HMG -CoA- Synthase und -Reduktase) . 
Die Resultate zeigen, daS feine Differenzen im Muster der 
Kem-His tori- Ace tylierung eine Rolle in der selektiven Genakti- 
vierung spielen. Das zeigt, daS die Bindung der Transkripti- 
onsfaktoren an die DNA eine notwendige, aber nicht ausreichen- 
de Bedingung fur die Transaktivierung ist (138) . 

SREBP-1 kann einige ahdere E-Box oder E-Box-like-Sequenzen im 
FAS-Promotor urid im S14-Promotor aktivieren, ist aber vollig 
inaktiv ftir degenerierte E-Box-Sequenzen z.B. im PK Promotor. 
Promotoren mit SRE-Bindungsstellen benotigen unbedingt NF-Y 
Oder SP1 als Cofaktoren fur die SREBP-Aktivierung. SREBP-1 hat 
eine wesentlich h6here Affinitat und ist effizienter in der 
Aktivierung von SRE enthaltenden Promotoren als von E-Box ent- 
haltenden Promotoren. 

In lipogenen Enzymeh, die Promotoren mit SRE-like-Sequenzen 
enthalten, aktivieren alle Isoformen von SREBP die Transkrip- 
tion (SREBP-la starker als SREBP-lc, SREBP-la bevorzugt gegen- 
liber SREBP- 2) . Die Bindung der SREBP- Isomeren an die verschie- 
denen BindungsdomSnen der Genpromotoren (136) ist in Fig. 6 
dargestellt . 

EinfluS vbii YYi auf die Regulation der lipogenen Gene 

YY1 ist bekannt al^ Transkriptionsmodulator, der sowohl als 
Enhancer und Repressor aber auch als Initiator-Bindungsprotein 
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wirken kann, was von der Herkunft der Zelle und den Bindungs- 
stellen des Promotors abhangig ist. YY1 ist auch in der Lage, 
den gleichen Promotor zu aktivieren und zu hemmen, wenn das 
intrazellulare Milieu verandert ist, das Bindungselement im 
Promotor mutiert (verandert) ist, oder die Bindungsstelle um- 
gebende DNA-Sequenz aiteriert ist. 

In Hinblick auf die betrachteten Gene lassen sich folgende 
Einfliisse von YY1 folgern. 

YYi besitzt eine hohe Affinitat zu SREBP-la. Im StAR- Promotor 
befindet sich eine YYl -Bindungsstelle, die mit der proximalen 
Bindungsstelle fur SREBP-la uberlappt. Die gleichzeitige Bin- 
dung von SREBP-la und YYI am StAR-Promotor reprimiert dessen 
Transkription.. Dieser Fakt beeinflufit wiederum den Chole- 
sterol transport und somit die Steroidhormonsynthese. 

YYI wirkt als Aktivator spezifischer Repressor, konkurriert 
mit den Bindungsstellen der SREBPs und deren Cofaktoren bzw. 
behindert sterisch die Biiidung der SREBPs z.B. an SREs der 
lipogenen Gene. Er wirkt sowohl als Typ-I-Repressor (Bindung 
an Cofaktoren, Komplexbildung) als auch als Typ- II -Repressor 
(direkte Bindung an die DNA, sterische Blockierung von Bin- 
dungsstellen) . Durch Mutation der Bindungsstelle in YYI konnte 
nachgewiesen werden, daS die SREBP-la Aktivierung des StAR- 
Promotors um ein Vielf aches anstieg. Untersuchungen an trans- 
fizierten HepG2 Zellen ergaben, daS YYI Mutanten (YY A 296- 
331, YY A 399-414, YY A 334-414 Oder YY A 154-199) Z.B. die 
sterolaktivierte Expression des LDL-Rezeptor und PPPS- 
Rezeptors nicht reprimierte. Die Mutationen YY A 334-414 oder 
YY A 154-199 verhindern die nukleare Lokalisation, die DNA- 
Bindung und die Ihteraktion mit CBP. YY A 296-331, YY A 399- 
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414 waren inaktiv bei der Repression der SREBP-la abhangigen 
Induktion der Expression des HMG-CoA Synthase -Promot or s (134) . 

Zahlreiche weitere Promotoren der sterolregulierten Gene ent- 
halten potentielle Bindungsstellen fur YY1 (CCAT oder ACAT) 
uberlappend oder angrenzend an Bindungsstellen der Coaktivato- 
jreh bzw. Trariskriptionsaktivatoren. Diese konnen durch YY1 
verdrangt oder blockiert und damit die Genexpression repri- 
miert werden (vgl. Fig. 7) . 

Nach dem gleicheri Prinzip werden auch die anderen Promotoren 
durch YY1 reprimiert. 

HDL-Rezeptor ► positiv reguHert durch SREBP-la plus SP1 oYYl (Repr.) 

LDL-Rezeptor positiv reguHert durch SREBP-la plus SP1 oYYl (Repr.) 

Fettsauresynthase 

Farnesyl Synthase ^ positiv reguliert durch SREBP-la plus NF-Y <-> YYl(Repr.) 

HGM-Co A Synthase 

HGM-CoA-Reduktasegenexpression wird durch YY1 nicht re- 
primiert . 

Der Synergismus der Bindung von SREBP und NF-Y bzw. SP1 an 
Promotoren der SREBP - re spoils iven Gene, einschlieSlich SREBP-2, 
ftihrt zur Aktivierung der Trariskription, die die Cholesterol- 
homoostase (LDL-Rezeptor, HDL-Rezeptor, HMG-CoA- Synthase und - 
Reduktase, FPP (Farnesylphosphat) -Synthase, Squalensynthase) 
die Fettsauresynthese (Fettsauresynthase und AcetylCoA- 
Acetylase) , den Fettsaureabbau (Stearyl-CoA-Desaturase) und 
die Triglyceridsyhthese (Glycerol-3 -phosphat- 

Acetyltransf erase) koiitrolliert (134) . 
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YY1 kann uber die o.g. Mechanisraen in diese Prozesse eingrei- 
fen. YY1 kann auch durch Interaktion mit SREBP-la die Erken- 
nung der Domane auf SREBP-la fur die RNA-Polymerase-II behin- 
dern und damit die Transkription reprimieren, was einen weite- 
ren regulatorischen Mechanismus der Transkriptionsregulation 
darstellt (134) . 

Beeinflussung der SREBP Aktivierung bei verschiedenen Erkran- 
kuiigen 

In hepatischen Zellen wird vorwiegend SREBP- 1c exprimiert, das 
in diesen Zellen auch durch Glukose und Insulin sowohl auf 
mRNA als auch auf Proteinebene stimuliert wird (139) . 

Bei experiment el lem Streptozotozin-Diabetes von Ratten wurde 
eine massive ErhShurig der Expression von SREBP-la und Fettsau- 
resynthase gefunden. Daraus result ierte eine starke Triglyce- 
ridakkumulation (TG) . Behandlung mit Insulin konnte beides 
senken. In Nierenzellen war bei hoher Glukose die Expression 
von SREBP-la und -lc mRNA und Proteinsynthese erhoht ebenfalls 
die Fettsauresynthese und damit die TG-Akkumulation. SREBP-1- 
Expression ist bei Diabetes mellitus erhoht. SREBP-1 spielt 
eine bedeutende Rolle in der Erhohung der Lipidsynthese, TG- 
Akkumukation, mesangialen Expansion, Glomerulosklerose und 
Proteinurie, indem es die Expression von TNFp und des vaskula- 
ren Endothe lwachs turns fakt or s erhoht (140) . 

Bei Typ-2-Diabetikern wurde eine signifikante Verminderung der 
SREBP-1 -Express ion im subkutanen Fettgewebe und im Skelettmus- 
kel gefxanden. Ex. vivo konnte dieser Effekt durch TNFa behoben 
.werden (141) . 
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Daher kann durch Auf- bzw. Abregulation von YY1 der Li- 
pidstof fwechsel entsprechend beeinflufit werden wie nachfolgen- 
de Ergebnisse bestatigen. 

Wie eingangs bereits erwahnt, unterscheiden sich BB/OK- und 
BB.6S-Ratten nicht nur signifikant in der Diabeteshauf igkeit 
Und Manifestatiohsalter. Im Alter von 12 Wochen sind BB.6S- 
Ratten im Vergleich zu BB/OK auch schwerer und das Serumge- 
samtcholesterol ist bei mannlichen und weiblichen Tieren und 
die Serumtriglyzeride sind bei Weibchen signifikant erhoht 
(24), Nach der 24. Leberiswoche sind auch die Serumtriglyzeride. 
bei den mannlichen BB.6S-Ratten signifikant gegenuber BB/OK 
erhoht, Auf Grund dieser Befunde lag der SchluS nahe, daS YY1 
auch im Fettstof fwechsel involviert ist. Daher wurde in einer 
Pilot studie gepruft, inwieweit die Applikation von YY1- 
Antisense der 4 Zirikfiriger die Lipide beeinflussen kann. 10-12 
mannlichen Ratten der St&mme BB/OK, LEW.1A, LEW.1W, WOKW und 
SHR wurden 600ng/l00^1 Ant i sense fur 2 Wochen, beginnend in 
der 9. Lebenswoche, applizieirt. Die Serumtriglyzeride (TG) , - 
gesamtcholesterol (Choi) und - HDL -Choele sterol (HDL) wurden 
vor (8. Woche) und nach Applikation (10. Woche) bestimmt. Die 
genet isch und phanotypisch differenten Stamme reagierten er- 
wartun^sgemafi unterschiedlich wie nachfolgend zusammengestellt 
ist. 
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Interessanterweise erkrankten von deii 12 BB/OK-Ratten bis zur 30. Lebenswo- 
che rtur 7 Tiere (58%), was den diabetesprotektiven Effekt von Yyl-PCR- 
Produkten emeut unterstreicht (s.S.32) . 



Wie fur den Typ 1 Diabetes beschrieben sollte es in Abh&ngig- 
keit vom Express ionsprof il der Probanden moglich sein, auch 
die Blutfette zu beeinflussen (vgl. Material & Methoden-Teil) . 

Vitamin D 7 Calciuitistbf fwechsel und Entwicklungsprozesse 

Vitamin D gehort heben dem Parathormon (PTH) , Calcitonin (CT) 
Und dem PTH related Peptide (PTHrP) zu den Hauptregulatoren 
des Calciumstoffwechsels. Seit 1966 ist bekannt, daS Vitamin-D 
in einer aktiven Form vorliegen mu&, urn seine funktionelle 
Aufgaben wahrnehmen zu konnen (143) . Die aktive Form entsteht 
durch die Hydroxylierung am C25 sowie am CI Atom. Bezeichnet 
wird diese Form als 1, 25-Dihydroxycholecalif erol oder als Vit- 
amin-^. Eine Aufgabe des Calciferols besteht darin, der Absen- 
kuiig . des PlasmacalciUmspiegels entgegen zu wirken. Erreicht 
wird dies uber eine vermehrte intestinale Calciumresorption, 
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durch gesteigerte rehale Calciumresorption und durch gestei- 
gerte Calciummobilistion aus dem Skelettsystems (144) . Die in- 
testinale Resorption benotigt ein aktives Transportsystem 
(Calcium bindende Proteine, Calbindin) , das nur in Anwesenheit 
von Vitamin-D 3 zu firiden ist. Daruber hinaus ist Vitamin-D 3 
auch fur die Erhaltung der Funktionsf ahigkeit der intestinalen 
Mucosazellen verantwortlich. Calbindine, Osteocalcin, Matrix- 
Gla-Protein, Osteopontin, Kollagen Typ I etc. werden durch 
Calciferol induziert. EinfluS auf die Proliferation, Diffe- 
renzierung, Hormonsekretion und Apoptose werden auch durch 
Calciferol ausgeiibt. Die BedeUtung des Vitamin-D 3 wird an Man- 
gelerscheinungen, sogenaimten Hypovitaminosen (Rachitis, 
Osteomalazie) deutlich (144) . 

Mit der Entdeckung des Vitamin-D-Rezeptors (VDR; 145, 146) 
konnte . der Wirkmechanismus untersucht werden. Mit Hilfe des 
VDR konnte gfezeigt werden, daS Vitamin-D im Kern von Keratino- 
zyten der Haut, Langerhansschen Inseln des Pankreas, Lympho- 
zyten, Promyelozyteh etc. lokalisiert ist. Die aktive Form des 
Vitamin-D ist lipophil, so daS es uber Diffusion durch die 
Zellmembran in die Zelle und weiter in den Zellkern gelangt 
und dort mit hoher Affinitat an seinen Rezeptor bindet. Der 
VDR gehort zu der Familie der ligandengesteuerten Transkripti- 
onsfaktoren. Nach Aktivierung durch seinen Liganden, moduliert 
VDR die Transkription solcher Genabschnitte, die ein dem Re- 
zeptor zugeordnetes DNA-Element tragen, die sogenannten Hormo- 
ne-Response-Elemente (HRE) . Fur den VDR werden diese Genab- 
schnitte Vitamin-D-Response Elemente (VDREs) genannt. Gene, 
die VDRE enthalten, sind u.a. Osteocalcin (OC) , Calbindin D9k 
(CALB3) und D28k (CALB1) , Vitamin-D 24 -Hydroxylase (CYP24) , 
Ostfeopb'nti-n (OPft)'-, atriale natriuretische Peptid (ANP) , Para- 
thormon (PTH) , Carbohanhydrase II (CA-II) , Integrin, beta-3 
(ITGB3) , Fibronektin (FN1) , c-fos, Parathormon- related Peptid 
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(PTHrP) , „slow myosin heavy chain 3 U (slowMyHC3) , gewebespezi- 
fischer Plasminogeriaktivator (t-PA) , Wachs turns fakt or 1 (PIT1; 
POU1F) und Involucrin (IVL) . 

Die Studie von DeLuca et al. (147) zeigte, daS sich die aktive 
Form des Vitamins auch in Lymphozyten (CD4 und CD8) , insbeson- 
dere in aktivierten T-Lypimphozyten befindet. Immunsupression 
von Autoimmunkrankheiten konhte auf die aktive Form von Vit- 
amin-D 3 und Ca 2+ zuriickgefuhrt werden. Da im Rahmen der vorlie- 
genden Erfindung gezeigt werden konnte, dafi bei Ca 2+ -reicher 
Diat die Diabetesinsidenz von BB.6S-Ratten von 15 auf 45% er- 
hoht werden kann, muS hier ein weiterer Regelmechanismus von 
YY1 existieren. 

Guo et al. (148) konnte erstmals die Rolle von YY1 im Calcium- 
s.tof fwechsel £ur das Ostedcalcingen zeigen. YY1 reprimiert die 
1, 25-Dihydroxcholecalcif erol vermittelte Transaktivierung des 
knochenspezifischen Osteocalcingens . Aufgrund der Interaktibn 
von YY1 mit beiden Komponenten, VDR und Transkrit ions fakt or 
IIB (TFIIB) , ist er in der Lage, die von Vitamin-D abhangigen 
Transkriptionen zu regulieren. Dariiber hinaus konkurriert das 
VDR/RXR (Retinoid X Receptor) -Heterodimer mit YY1 urn die Bin- 
dungsstelleri der VDR-Elemente im Osteocalcingen. Da VDREs in 
vielen Genen vorhanden sind, ubernimmt YY1 dort weitere regu- 
latorische Rollen. 

Zusatzlich ist es YY1 moglich, bereits in die Synthese von 
Calciferol einzugreif en. Durch die Repression der Transkripti- 
on des Eiizyms, 25-Hydroxyvitamin-D3-24-hydroxylase [24(OH)ase; 
CYP24], ist der Katabolismus gestort. Eine erhohte Repression 
konnte in AhwesenKeit vdn TFIIB oder CBP (CREB -Binding - 
Ptoteiii) festgestfellt Werden (149) . Dariiber hinaus konnte bei 
tfaiisgerten Ratten, bei ddnen CYP24 iiberexprimiert wurde, ge- 
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zeigt werden, daS diese Tiere eine Albuminurie und Hyperlipi- 
damie entwickelten. Eine Beobachtung, die in diesem Zusammen- 
hang an die erhohten. Blutfette der BB.6S-Ratten im Vergleich 
zum Parentalstamm, der BB/OK-Ratte, erinnert. Auch entwickel- 
ten diese transgenen Ratten atherosklerotische Lasionen an der 
Aorta (150) . 

DaS der VDR im Zusammenhang mit dem Typl-Diabetes steht, konn- 
te von der Gruppe Chang et al. (151) gezeigt werden. Als di- 
rekter negativer Faktor fungiert die aktive Form von Vitamin-D 
auch im Renin-Ahgibterisin-System. Dieses System spielt eine 
wichtige Rolle in der Regulation des Flussigkeits- und Elek- 
trolythaiishalts und admit- auch in der Blutdruckkontrolle. Bei 
Abweichurig des Vitamin-D-Levels kommt es zur direkten Inhibie- 
rung der Renin- Gen- Express ion. Somit spielt Vitamin-D nicht 
nur als Regulator bei der Auf rechterhaltung der Calcium- 
Homostase eine Rolle sondern auch im Homostase-Prozess der 
Elektrolyte, dem Blutvolumen und Blutdruck (152) . Unterstut- 
zend dazu kaiin die Studie von Bhalla et al. (153) herangezogen 
werden. Man koiinte zeigen, daS YY1 synergistisch mit GATA-4 
als transkriptioneller Komplex iiber CBP/p300 die „brain natri- 
uretic" Peptid (BNP) -Gen-Transkription aktiviert. BNP gehort 
zur Familie der hatriuretischen Peptide, die aus 3 Peptiden 
(atriale natriuretische Peptid, ANP; BNP; natriuretische Pep- 
tid Typ C, CNP) besteht. Ihre Hauptwirkung liegt in einer Zu- 
nahme der Natriumausscheidung, in einer Gefafierweiterung 
(Vasodilatation) und in einer Abnahme der Aldosteronsekretion 
(wichtigstes Mineralocorticoid, beeinfluSt den Natrium-, Kali- 
um- und Wasserhaushalt in samt lichen Geweben) , womit sie den 
eigentlichen Gegenspieler des Renin- Angiotensin-Aldosteron- 
Systems dairst^llen. GATA-4 gehort zu der Familie der GATA- 
Zink- Finger- Transcriptions faktor en und ist im adulten Gewebe 
des Herzerts> im ifarmepithel und Gonaden exprimiert. Wahrend 
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der Fetalentwicklung ist GATA-4 bei der Herzformation betei- 
ligt. Daher fungieren GATA-4 als auch YY1 gleichermaSen als 
Schlxisselelement bei der myocardialen Dif f erenzierung und 
Funktion. Beide beeinflussen zahlreiche Herz-Gene (154-158) . 
Onter Anderem konnte gezeigt werden, dafi YY1 in Verbindung mit 
der Hypertrophy in Herzmyocyten (iiber ILlp vermittelt) steht 

(159) . 

in Anbetracht der bisher vorliegenden Arbeiten, sowie eigener 
Ergebnisse (s.o.), kann der SchluS gezogen werden, daS YY1 in 
den Calciumstoffwechsei selbst eingreift oder aber durch Cal- 
cium (und deren Koirrponenten) beeinfluSt wird. Aufierdem kann 
davori ausgegangen werden, daS YY1 eine wesentliche Rolle bei 
der Blutdruckregulation und Muskelkontraktion zukommt. Daher 
soil je nach betroffenem Gewebe und in Abhangigkeit vom Ge- 
schlecht YY1 ab- oder aufreguliert werden. 

Mit Hilfe von Maus-Embryonen konnte dargestellt werden, daE 
YY1 in dem Entwicklungsprbzess von Knochen eine bedeutende 
Rolle hat. Er ist in der Lage das MSX2 Gen zu aktivieren 

(160) . MSX2 gehort zu der Klasse der Homoobox-Genen und wird 
ill zahlreichen Geweben von Embryonen exprimiert. Als Schlus- 
selmediator ist MSX2 wahreiid verschiedenster Entwicklungspro- 
zesse, wie zura Beispiel bei der Formation von Schadel, Zahnen, 
Augen, sowie in der cranio- facialen Morphogenese beteiligt. Er 
ist involviert in der epithelialen-mesenchymalen Interaktion 
und Apoptose (161-165) . Bei Dysregulation des Expressionslevel 
von Mxs2 konnte abnormes Wachstum festgestellt werden. Zwei 

. Faktoren, BMP4 (Bone Mdrphdgehetic Protein Typ 4) und YY1 re- 
gulieren die Expression von MSX2 in embryonalen Geweben (166) . 
Onabhangig voii BNP4 ist Ytfl iifi Stande an drei Stellen des Pro- 
motors von MSX2 zu. biiideh und somit zu aJctivieren (160) . Die 
Irivolvation von YY1 in die Prozesse der Embryogenese, Neuro- 
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nal-, Skelettmuskel- und Knochfcneiitwicklung laSt den SchluS 
zu, daS YY1 mit Sicherheit bei Mutation oder Fehlregulation an 
Erkrankungen der Muskeln, Knochen und dem Gehirn entscheidend 
beteiligt sein wird (167) . Daher kann auch hierbei je nach be- 
troffenem Gewebe und in Abhangigkeit vom Geschlecht, YY1 ab- 
oder aufreguliert werden. 



Nutzung der Erkenntnisse 
1. Diagnostik 

DNA- Sequenz und Genexpressioh 

Ausgehend von def vorliegeinden YY1 Sequenz werden unter Ver- 
wendung der in Fig. 11 aufgeftihrten Primer Sequenzanderungen 
in YY1 zur Diagnose von moglichen Fehlleistungen genutzt. Dazu 
wird genomische DNA und ssDNA aus mononuklearen Blutzellen mit 
den Primern amplifiziert und sequenziert bzw. Punktmutations- 
analysen (SNPs) durchgefiiihrt (vgl. Kwok P.Y. SNP genotyping 
with fluorescence polarisation detection. Hum. Mutat. 19, 
2002, 315-323) . 

Daruber hinaus wird RNA aus mononuklearen Blutzellen und Gewe- 
be durch Biopsie (Muskel, Fettgewebe, Haut) bzw. durch Punkti- 
on von Niere und Leber gewonrien, uttigeschrieben in ssDNA und 
sequenziert (Umschreibung in ssDNA) sowie zur Genexpressions- 
analyse eingesetzt, wie oben beschrieben (vgl. S. 22/23, 
"Genexpressionsstudieh") . Es wird davon ausgegangen, daS in 
den Gewebeii uriterschiedliche Express ionsmuster und auch 
SpleiSvari&hten (s\ verkurzter Zinkfinger bei BB.6S in Leber, 
Paiikreas und iiirri) auftreten konnen und wichtige Hinweise zur 
Regulation von YY1 in den Geweben und zur Erkrankung geben. 
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Diese Gewebe kommen in Betracht, da beim Typ-1 -Diabetes diabe- 
tische Folgeerkrankungen auftreten konnen, die sich in ver- 
schiedenen Geweben manif estieren (diabet ische Nephropathie , 
Retinopathie, Neuropathie etc.). Folgeerkrankungen sind u.a. 
Fettstof fwechselstdrungen (Fettgewebe, Leber) , Bluthochdruck 
(Niere) , Herz-Kreislauf erkraiikungen (Muskelgewebe) aber auch 
dermatologische Erkrankungen (Haut) . Da nicht alle Diabetiker 
gleicherttiaEen an alien Folgeerkrankungen leiden, wird erwar- 
tet, daS das Express ionsprof il von Proband zu Proband unter- 
schiedlich ist. 

ELIS A (Enzyme- linked immunosorbent assay) 

,Um serologische . Tests zur Diagriostik durchfuhren zu k&nnen, 
kaiin die Sequenz genutzt werden, urn verschiedene ELISA- 
Verfahren zu etablieren. Dafur werden monoklonale und polyklo- 
nale Antikorper erzeugt. 

Herstellung von polyklonalen und monoklonalen AntikSrpern 
(s. Ref 89) 

Es Werden erf ihduiigsgem&S poiyklohale Antikorper gegen YY1 
hergestellt. Zur Erzeugung konhen Kaninchen genutzt werden. 

Das Protein YY1, synthetisch hergestellt und individuell fur 
den Probanden, wird mit einetn sogenannten vollstandigen 
Freuridschen Adjuvans verSetzt. Das Adjuvans schiitzt das Prote- 
in YY1 vor der Degradierung , Das Freundsche Adjuvans besteht 
aus . einer Mischung von Paraffinol und Manidmonooleat, der in- 
aktivierte und getirocknete Tuberkulosebakterien (Mycobacterium 
tuberculosis ) zugesetzt wurdeii. Dies bewirkt im Tier eine all- 
gemeine Immunreaktivitait, die primare Immunantwort . Das Ge- 
miseh wird intradermal, subkutan oder intramuskular ins Kanin- 
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chen injiziert. Nach ungefahr vier bis sechs Wochen wird das 
gleiche Protein mit inkompletten Adjuvans (Bakterien fehlen) 
emeut injiziert, urn eine sekundare Immunantwort auszulosen. 
In Abhangigkeit vom Antikorpertiter wird das Tier entblutet 
und das Antiserum gewonnen. 

Fur die Herstellung monoklonaler Antikorper (mAK) wird die von 
Kohler und Milstein entwickelte Hybridoma-Technik angewandt. 

Mause werden rait dem YY1- Protein, dafi in Abhangigkeit von der 
DNA-Sequehz des Pfobahdeii synthetisch hergestellt wird, immu- 
nisiert. Die aritikSrperproduzierenden Milz-Lymphozyten werden 
anschliefiend in Kultur mit Myelomzellen (Krebszellen) fusio- 
niert in Anwesenheit von Polyethylenglykol . Nach Fusionierung 
werden die sogenannten Hybridome in Mikrotitertestplatten (0,2 
ml Volumen) verteilt und mit dem HAT (Hypoxanthin-Aminopterin- 
Thymidin) -Selektionsmedium kultiviert. Das Medium gewahrlei- 
stet, dafi nur Hybridome wachsen. Nach 10 Tagen Kultur werden 
die Hybridome vereinzelt und in Kultur weitervermehrt . Die mAK 
werden aus den Zellkulturuberstanden isoliert. 

Reinigung der Antikorper (Aff initatschromatographie) (s. Ref. 
89) 

Da Antiseren neben den spezifischen Immunglobulinen, die gegen 
YY1 gerichtet sind, noch weitere Antikorper enthalten, soli 
mittels einer Aff initatschromatographie die Aufreinigung er- 
folgen, YY1 wird dabei an eine feste Matrix gebunden. Nur An- 
tikorper, die spezifisch gegen YY1 gerichtet sind, binden. Al- 
le anderen Antikorper passieren die Saule. Die spezifischen 
Afftikorp^r werden dufch pH-Wert Veranderung (auf 2,5 oder iiber 
11) von YY1 eluieirt. \ 
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Diese spezifisch aufgereinigteh Antikorper gegen YY1 konnen 
dann in weiteren Schritten im ELISA-Verfahren oder Western 
blot genutzt werden. 

Gegenstand der vorliegenden Erfindung sind daher auch Antikor- 
per, die gegen ein vorgenanhtes Protein oder Peptid der Erfin- 
dung gerichtet sind. Vorzugsweise handelt es sich bei den An- 
tikorpern urn monokionale Antikorper. 

In diesem Zusammenhang dienen auch Sandwich- ELISA zum Antigen- 
nachweis, und geeignet ist auch der Nachweis spezifischer An- 
tikorper gegen ein Antigen mittels enzymmarkierten Sekundaran- 
tikorpern. 

Etablierung der ELISA-Verfahren (s. Ref • 89) 

Nachweis spezifischer Antikorper gegen YY1 mittels enzymmar- 
kierten Sekundarantikorpern 

Synthetisch hergestellte YYl-Prdteine werden an einen festen 
Trager (Kunststof f oberflachen, Mikrotiterplatte) gekoppelt . 
AnschlieSerid wird das zu lintersuchende Probandenmaterial (Se- 
rum) iiberschichtet. Spezifisch gegen YY1 gerichtete Antikorper 
im Serum befindlich, binderi. Uhg'ebundene Komponenten werden 
heruntergewaschen. Mittels eines Sekundarantikorpers, chemisch 
mit einem Enzym markiert, wird in der Farbreaktion das Sub- 
strat umgewandelt. Anhand eines mitgefuhrten Standars kann 
dann, nach Erstellung der Eichkurve, direkt mit der Antikor- 
perkonzentratibn korreliert werden. 
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Sandwich- ELiSA (Antigennachweis) (s. Ref. 89) 

Die Antikorper, spezifisch gegen YY1 gerichtet, werden an ei- 
nen festen Trager (Kunststof foberf lachen, Mikrotiterplatte) 
gebunden. Im Anschlufi daran wird das Probandenmaterial uber- 
schichtet. Die YYl-Proteine binden spezifisch an den Antikor- 
per. Urigebundene Komponente werden heruntergewaschen. Mittels 
monoklonaler Antikorper und eines Anti-Antikorpers (Enzym-mar- 
kiert) wird die Menge an YYl-Prbteinen ermittelt. 

Westernblot (s. Ref. 144 ) 

Es wird davon ausgegangen, daS zwischen den Probanden, bedingt 
durch alternatives SpleiEen oder bereits genet isch bedingt, 
sich die YYI-Proteine in ihrer Grofie (Molekulargewicht) unter- 
scheiden. 

Daher kann mit Hilfe einer SDS-Polyacrylamid~Gelelekrophorese 
(SDS-Page) YY1- Proteine nach ihrer GroSe aufgetrennt werden. 
Durch das SDS erhalten die Proteine negative Ladungen (SDS- 
Bihdung) . Nach dem gelelektrophoretischen Lauf wird das Trenn- 
cjel auf eine immbb'ilisierte Membran (Nitrozellulose) transfe- 
riert. Mittels spezifischer Antikorper gegen YY1 gerichtet und 
Alkalischer Phoshatase werden die Proteine angefarbt. 

Gegenstand der Erfindung ist sorait ein Verfahren zur Bestim- 
mung der Neigung, an Typ-1 -Diabetes, Autoimmunerkrankungen im 
allgemeinen (insbesondere, Arthritis, Multiple Sklerose, Au- 
toimmune Encephalomyelitis, Zoliakie) , Typ- 2 -Diabetes, Krebs 
(insbesohdere Lungenkrebs , Brustkrebs, Darmkrebs, u.a.) oder 
Mrierai- urid Lipidstof fvieichselstorungen zu erkranken, bei dem 
than geriomische DNA ails isbiietteii mononuklearen Blutzellen am- 
plifiziert, sequenziert und man Anderungen oder Abweichungen 
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der Nukleinsauresequenz, die fur ein Protein mit der in SEQ ID 
NO: 6 dargestellten Aminosauresequenz kodiert, bestimmt, wobei 
Abweichungen von Codons (nicht-stille Mutationen) eine erhohte 
Neigung anzeigen, an einer der vorgenannten Krankheiten zu er- 
kranken. 

Weitere Mutationen, die auf hohere Diabetesneigung hindeuten 
konnen, liegen in folgenden Sequenzbereichen und lassen sich 
unter Verwendung folgender Primer nachweisen: Intron 4: Pri- 
. mer: K815-P/K817-R; K815-F/K875 ; K821-F/K817-R; K821-P/K870- 
R; K874-F/K870-R. Zur Amplif ikation verwendet man vorzugsweise 
die Primer K823-F/K825-R; K884-F/K806-R; K801-F/K804-R; K814- 
F/KK832-R; K828-F/K833-R; K831-F/K817-R; K815-F/K870-R; K815- 
F/K818-R; K816-F/K819-R; K834-F/K836-R, F15/R12; F15/R14; 
F15/R13; F57/R16; F57/R20; F57/R21; F59/RR25; F59/RR30; 
F59/R33; F95/R34; F96/R39; F95/R48; F95/R50; F60/R7; F60/R8; 
F60/R66; F60/R67; F96/R76; F96/R77; F96/R81 F96/R83; F33/R1; 
F33/R4; F33/R15; F39/R28; F40/R3; F41/R5; Oder andere Kombina- 
tionen. 

Ferrier eingeschlossen ist ein Verfahren zur Bestimmung der 
Neigung, an Typ-l-Diabetes, Autoimmunerkrankungen im allgemei- 
nen (insbesondere Arthritis, Multiple Sklerose, Autoimmune En- 
cephalomyelitis, Zoliakie), Typ- 2 -Diabetes oder Krebs (insbe- 
sondere Lungenkrebs, Brustkrebs, Darmkrebs, u.a.) oder Mine- 
ral- und Lipidstoffwechselstorungen zu erkranken, bei dem man 
RNA aus isolierten mononuklearen Blutzellen oder Gewebsbiopsi- 
en (Fettgewebe, Muskelgewebe, Haut) - bzw. Gewebspunktionen 
(Leber, Niere). isoliert, amplif iziert und quantif iziert, wobei 
eine erhohte/verminderte Expression eine erhohte/verminderte 
Neigiing anzeigt, an Typ-l-biabetes, Autoimmunerkrankungen im 
allgemeirien ( insbesondere Arthritis, Multiple Sklerose, Au- 
toimmune Encephalomyelitis , Zoliakie), Typ- 2 -Diabetes, Krebs 
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(insbesondere Lungenkrebs , Brustkrebs, Darmkrebs, u.a.) oder 
Mineral- und Lipidstof fwechselstorungen zu erkranken- (vgl. 
oben zu 'Genexpression' ) . 

2. Behandlung 

2.1 Nutzung von DNA oder Antisense 

Zur Abregulation von YY1 soil DNA oder Antisense von der vor- 
liegend^ri Seqiienz mittels PCR eirzeugt und appliziert werden. 
Sowohl DNA als auch Antiseinse-Oligonukleotide werden modifi- 
ziert,um ihre Stabilitat gegenuber den meisten Exo- und Endo- 
riukieasen zu erhobeh (168) '. Die Applikation der stabilisierten 
DNA oder Antisense erfolgt subktitan (s.c.) oder intramuskular 
(i.m.). Die Dosis irichtet sich riach der individuellen Expres- 
sion von YY1, die in bestimmten Abstanden gepriift werden soil, 
urn eine ausgewogene Balance von YY1 im Hinblick auf andere Ge- 
ne zu erreichen. 

Antisense diigbnukleotide 

Da die Antisense Oligonucleotide eine hohe Spezifitat besit- 
zen, kdnnen sie spezifisch binden, die RNA blockieren und so- 
mit die Expression verhindern. Die Antisense Oligonukleotide 
sollen im Abstand von 2 bis 20 Basen uber die Sequenz verteilt 
werden. Dabei wird vorzugsweise bei Position 73 begonnen. 

Wichtige Fragmente, bei denen mehrere Antisense- 
Oligonukleotide hergestellt wurden (immer um eine Position 
verschoben), sirid: 73 bis 564, 565 bis 717 f 718 bis 834, 835 
bis 1071; 955 bis 999, 955 bis 1041, 1000 bis 1041, 1042-1125, 
1759 bis 1848, 1849 bis 1938, 967 bis 1125, 1071 bis 1938 so- 
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wie die Intronsequenz 1126-1758. Die PCR-Amplif ikation erfolgt 
wie beschrieben (12) . 

Oligonukleotid-Modifikationen 

Zur Verbesserung der Ef f izienz/Stabilitat mit Hilfe von: 

1 . ) Methylphosphonaten 

2 . ) Phosphorothioaten 

- Nuclease-resistent, wasserloslich, starke Hybrydisierung mit 
m-RNA 

- steigert Rttase H Aktivitat, die verantwortlich ist fur den 
Abbau von m-RNA im Doppelstrang 

3 . ) Phosptiodithionate 

4. ) Polyamid-Ruckgrat (PNA-DNA-C^imare) statt Pentose- 
Phosphat (Uhlmann E. , Peyman A. , Breipohl G. , Angew. Chem. 
1998, 110, 2954-2983.) 

- Chimare besser fur die Zellaufnahme 

Verbesserung der Transporteigenschaf ten mit Hilfe von: 

1. ) Alkylieruhg (Hydrophobie erhoht) 

2 . ) Kopplung ah Zucker 

Ribozyme 

Ribozyrhe sind katalytische RMA ,mit enzymatischen Eigenschaf- 
ten (Phosphatester-Hydrolyse; Nobelpreis Chech/Altmann) . Ribo- 
zyme erkennen bestimmte Basensequenzen in der mRNA und zer- 
schneiden das Molekiil ah diesen Stellen. Sie haben demnach ei- 
ne Doppelfunktibn, das Erkennen einer bestimmten Struktur, 
danii hydrolytisclie S'paltung einer Phosphordiesterbindung an 
einer bestimmten Stelle. Zwei Klassen von Ribozymen haben be- 
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sondere Bedeutung. Solche iriit einer hammerformigen ("hammer- 
head" ) -Struktur und andere, die eine Haamadel ( "hairpin" ) - 
Struktur aufweisen. Die von den Ribozymen entwickelte Endonu- 
kleaseaktivitat kann praktisch gegen alle RNA-Strukturen wirk- 
sam werden. 

Triple -Helix-Bindung 

Dariiber hinaus soli ein dritter Nukleotidstrang an eine DNA- 
Doppelhelix \iber zusatzliche (Hoogsteen-) Basenpaarung gekop- 
pelt werden. Damit entsteht eih Stuck eines Dreifachst ranges, 
das nicht mehr transkribieirt werden kann. Die Positionen in 
der DNA sind abharigig von der Sequenz struktur des Probanden. 
Nachteil: Erkennnuhg liur in Purin-reichen Regionen 

Gegenstand der Erf indung ist daher auch die Verwendung einer 
vorgenaimten Nukleinsaure oder eines Antisense-Oligonukleotids 
zur Herstellung einer pharmazeutischen Zusammensetzung. Die 
pharmazeutische Ztisairimensetzurig dient insbesondere zur Behand- 
lung von Typ-1 -Diabetes, Autoimmunerkrankungen im allgemeinen 
(insbesondere Arthritis, Multiple Sklerose, Autoimmune Ence- 
phalomyelitis, Zoliakie) , Typ-2-Diabetes oder Krebs (insbeson- 
dere Lungenkrebs, Brustkrebs, Darmkrebs, u.a.) oder Mineral - 
und Lipids tof fwechselstorungen. 

Ferner betrifft die Erfindurig eine pharmazeutische Zusammen- 
setzung, die eine voirgenannte Nukleinsaure oder ein Antisense- 
Oligonukleotid sowie gegebenenf alls zusatzliche, pharmazeu- 
tisch vertragliche Hilfs- und/oder Tragerstoffe enthalt. Die 
Zusammensetzungen sind vorzugsweise in einer zur intravendsen 
(i.v.), sito'dutatieh (s.c.) oder intramuskularen (i.m.) Applika- 
tibn geeigheteii Form formuliert :. 
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2.2 Nutzung des Proteins 

Das Protein YY1 oder Peptide desselben werden synthetisiert, 
urn appliziert werden zu konnen. Bevorzugte AS-Fragmente sind: 
1 bis 165, 166 bis 215, 216 bis 254, 255 bis 323, 255 bis 302, 
255 bis 309 (mit und ohne Mutation) , 310 bis 323 (mit und ohne 
Mutation), 324 bis 351, 352 bis 381, 382 bis 411. Daruber hin- 
aus wird der verkiirzte BB.6S- Bereich von 299 bis 351 bevor- 
zugt. In diesetn Zusammenhang kann die fur ein Protein mit der 
in SEQ ID NO: 6 ikodierende Nukleinsauresequenz , insbesondere 
die Sequehz geniaS SEQ ID NO: 5, oder Fragitiente derselben in ei- 
hen Expressionsvektor eingebracht und unter Bedingungen expri- 
miert werden, die fur das gewahlte Vektorsystem geeignet oder 
vorteilhaft sind. Entsprechehde Verfahren sind dem Fachmann 
wohlbekannt . 

Dabei stehen Modif ikationen des Proteines oder der Peptide 
durch : 

a) Acetyl iervingen 

b) Deacetylieruiigen 

c) Methylierung^n 

d) Phosphorylierungen 

e) O- und N- Glykosylierungen 

im Vordergrund, urn Stabilitat und Aktivitat zu erhohen bzw. zu 
verandern. 

Die Erfindxong betrifft somit auch die Verwendung eines oder 
mehrerer der oben genannten Proteine und/oder Peptide zur Her- 
stelluhg diiier piiarmazeutischen Zusammensetzung. Die pharma- 
z'eutische Zuskfhifi^dtz'utfg dierit insbesondere zur Behandlung 
vori Typ-l-Diabetes, Autbimmunerkrankungen im allgemeinen (ins- 
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besondere Arthritis, Multiple Sklerose, Autoimmune Encepha- 
lomyelitis, Zoliakie) , Typ- 2 -Diabetes oder Krebs (insbesondere 
Lungenkrebs , Brus tkrebs , Darmkrebs , u . a . ) oder Mineral -und Li - 
pidstof fwechselstorungen. 

Eingeschlossen sind ferner pharmazeutische Zusammensetzungen, 
die ein oder mehrere der oben genannten Proteine und/oder Pep- 
tide enthalten, wobei die Proteine und Peptide gegebenenf alls 
wie oben beschrieben modifiziert sind. Die Zusammensetzungen 
enthalten gegebenenf alls zusatzliche, pharmazeutisch vertrag- 
liche Hilfs- und/dder Tiragerstof f e und sind vorzugsweise in 
einer zur intravenosen (i.v.) , subcutanen (s.c.) oder intra - 
muskularen (i.m.) Applikation geeigneten Form formuliert. 

Spleifivariahten 

Daruber hinaus konnen alle moglichen SpleiSvarianten (s. un- 
ten) mit Hilfe der im Rahmen der Erfindung untersuchten Se- 
quenz erfaSt werden, urn verschiedenste Proteine erzeugen zu 
konnen. Die SpleiSvarianten unterschiedlicher Grofie sind nach- 
folgend aufgezeigt. Diese Proteine werden vorzugsweise wieder- 
um niodifiziert (s. oben), um einen spezifischen Einsatz zu er- 
moglichen. Sie koiinen eiitweder eirizeln auch in Kombination 
eingesetzt werden. 

Potentielle SpleiEvarianten (http: //www. itba.mi.cnr.it) 



DONOR SITES: 

POSITION EXQN INTRQN SdORE 



157 


GAG GTGGAG 


78. 


379 


GAG GTGATT 


85. 


. . 406. ... . 


. GAG GTAGTG 


81. 


409 .,. 


. . GTA GTGGGT 


8.1 . 


475 


. CCG GTACCC . ■ 


. 75. 


. 668 


CGG GTAATA 


.80. 


694. 


CAG GTGCAG 


78. 
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1129 


CAG GTAOftO 


7Q 

/ 27 .... 


1172 


CTG GTOARO 


O j . 


1214 


GGGJ gtattt 


7*3 


1273 


CAG GTGTTA 


77 


1363 


GTA GTGAGT 


ou . 


1370 


GTA GTGTGT 


70. 
/ ^ f 


1423 


CAG GTGAPA 




1453 


CTC GTGAGf 


79. 


1605 


CCA GTGTGT 


78. 


1671 


ATA GTAGGT 


ou . 


1675 


TAG GTGGTT 


77 
f ' t 


1693 


GCA GTGAGP 


7Q 


2172 


AAG GTGTTT 


70 
/O . 


ACCEP'FbR 
POSITION 


SITES: 

TNTRPN TTYVyNT 


QPO"DT? 
oLAJJfcvJi 


31 


Ctpppgpag rrra 


0 / - 


36 


GPAGPPPAG GAGP 




335 


gcgctgpag rrnp 


/ O - 


747 


• GGTPTTPAG 


0 u . 


882 


APPTPTPAG APPP 


OU . 


1036 


PGGTPPPAn anTP . 


7 Q 


1053 


TCTGTGPAG AATG 


7 7 
' ' t 


1274 . 


GGACTGPAG GTGT 


o.M - 


1333 


TTCTAGCAG GTTT 


7 Q 


1365 


wX X X XV7X.ra.VY IUAVJ • 


oU . 


1418 


TGGCTACAG PTPP 


77 

: LI 


1424 


CAGCTPCAG GTGA 


OX . 


- 1447 


TGPTTATAG AAftA 


ou . 


1510 


ACTTCCTAG AGTG . 


81 


1572 


TTTCTCAAG AACT 


84 . 


1713 


GATCCCCAG GTTC 


80. 


1734 


TTTGCCAAG AGGG 


78. 


1763 


CCTTGACAG TGCA 


85. 


1989 


CCTCTTCAG GAGT 


79. 


2037 


TATTTCTAG GAAG 


83. 



Die SpleiSvarianten werden durch entsprechende Restriktionsen- 
zyme erhalteh. Die Verwendiing der SpleiSvarianten hangt von 
der individuellen Situation der Probanden ab. 

Antikorper 

Dariibef hinaus werden monoklonale Antikorper fur Bereiche des 
YY1 - Proteins erzeugt und zur Abregulation verwendet. Auch 
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hierbei sind die Antikorper der individuelle Situation anzu- 
passen. 

2.3 Erhohung der YY1 -Expression 

Die gesamte DNA-Sequenz oder Teilsequenzen von YY1 (Positionen 
73 bis 564, 565 bis 717, 718 bis 834, 835 bis 1071; 955 bis 
999, 955 bis 1041, 1000 bis 1041, 1042-1125, 1759 bis 1848, 
1849 bis 1938, 967 bis 1125, 1071 bis 1938 sowie die Intronse- 
quenz 1126-1758) , die sicft riach dfcir individuellen Situation 
der Probanden richtet, werden in Plasmiden unter Kontrolle eu- 
karyotischer, gewebsspezif ischer Promotoren kloniert und zur 
Langzeitexpression von YY1 an sich oder seiner Teilsequenzen 
appliziert, urn eine gewebsspezif ische Erhohung der Expression 
von YY1 oder seiner Teilsequenzen zu erreichen. Die Vektorsy- 
steme werden entsprechend dem Stand der Technik einge- 
setzt(l69). 

2,4. Regulation aiiderer Gene durch YYl-Antisense 

Angesicht der Multifuhktiorialitat von YY1 wurde Antisense-DNA 
von YY1 mit den in der Genbank vorhandenen Sequenzen auf Uber- 
seinStimmung mit anderen Generi gepriift (siehe Pigur 13; die 
angegebenen Positionen (Numerierungen) beziehen sich auf den 
kodierenden Bereich uhd nicht auf die Nukleotidnumerierung des 
Sequenzprotokolls) . Diese entsprechenden Sequenzen sollen un- 
ter Nutzung von Kem-Lokalisationssignalen (NLS) mit Domanen 
von YY1 gezielt zur Beeinf lussung dieser Gene (funktionelle 
Domarie) eingesetzt werden (vgl. Fig. 8) . 

Die AktivieM^sdomanen, Repress ionsdomaiien und Zinkfinger von 
YY1 sollen aliein lirid in alien Kombinationsmoglichkeiten mit- 
einarider, mit der Antisense-DNA kreiert werden. Die Kombinati- 
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ori ist abhangig vom krankheitsbild, den betroffenen Organen 
und vom Geschlecht. 

kongene und transgene Tiere 

Im Rahmen der vorliegenden Erfindung wurden ferner kongene 
nicht-menschliche Sauger, vorzugsweise Ratten, erzeugt, die 
eine fur (das mutierte) YY1 gemafi SEQ ID NO: 4 kodierende Nu- 
kleinsauresequenz enthalten. Bei dem Sauger handelt es sich 
vorzugsweise urn eine Ratte. Die Sauger sind durch eine ernied- 
rigte Typ- 1 -Diabetes inzidenz charakterisiert . In gleicher 
Weise ist es mSglich, transgene Sauger, vorzugsweise Ratten, 
zu erzeugen, die sich dadurch auszeichnen, dass sie ebenfalls 
eine fur (das mutierte) YY1 kodierende Nukleinsauresequenz 
(s.o. ) enthalten. 

Die Erfindung stellt ferner erstmals ein Verfahren zum Identi- 
fieren diabetesprotektiver Wirkstoffe bereit, bei dem den vor- 
genannten Saugern potentielle Wirksubstanzen verabreicht wer- 
deh und man xiberpruft, in wieweit die Neigung, Typ- 1 -Diabetes 
zu entwickeln, reduziert Wird. Gegehstand der Erfindung ist 
somit auch die Verwendung eines transgenen oder kongenen 
nicht-menschlicher Saugers, dessen Keim- und somatische Zellen 
eine Nukleinsaure oder einen Nukleinsaureabschnitt enthalten, 
die/der fur ein Protein mit der in SEQ ID NO: 4 (SHR) gezeigten 
Amindsauresequenz oder einer dazu homologen Aminosauresequenz 
(s.o.) kodiert, wobei die homologe Aminosauresequenz an Posi- 
tion- 303 /Methionin* uild an Position 311 Arginin aufweist, zum 
Identifizieren Diabetes -protektiver Substanzen. 
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Die Erfindung betrifft ferner transgene nicht-menschliche Sau- 
ger, insbesondere Ratten, deren Keim- und somatische Zellen ei- 
ne Nukleinsaure Oder eirien Nukleinsaureabschnitt enthalten, 
die/der fur ein Protein rait der in SEQ ID NO: 2 gezeigten Ami- 
nosauresequenz oder einer dazu hottiologen Aminosauresequenz 
(s.o.) kodiert, wobei die hombloge Aminosauresequenz an Posi- 
tion 303 Arginin und an Position 311 Lysin aufweist. 

Weitere Erf indunqscrecrenstande 

Die Erfindung betrifft ferher weitere Gegenstande und Ausfuh- 
rungsformen, die sich fxir deh Fachmann vor dem Hintergrund der 
vorliegenden Offenbarung muhelos erschlieSen. 

In diesem Zusammenharig sind auch Vorrichtungen (Kits) zur 
DUrchfiihrung eines der vorgerianiiteh (Screening-) Verfahren zu 
nennen . 
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1. Tierhaltung 

Die Tiere wurden unter Semibarrierebedingungen gehalten und 
hatten freien Zugang zu Pelletfutter (Ssniff R-Zucht, Spezia- 
litaten GmbH, Soest) sowie Wasser (pH 2,5 - 3). 

Die Tiere wurden unter einem 12 Stunden Rhythmus gehalten (12h 
Liclit, 12h Dunkelheit) . In einem Kafig befanden sich maximal 3 
Tiere . 

Alle tierexperimentellen Arbeiteii erfolgten unter Einhaltung 
der gultigen Tierschutzbestimmungen. 

2. Erzeiigung deir korigerieh BB. 6S 

Kauflich erworbene, mannliche SHR/Mol -Ratten (Mollegaard Bree- 
ding Ltd, Danemark) wurden mit diabetischen BB/OK-Weibchen ge- 
kreuzt. Die resultierenden Fl-Hybriden wurden auf diabetische 
BB/OK-Ratteh insgesamt 7 mal ruckgekreuzt . Die Nachkommen 
jeder Ruckkreuzungsgeneration wurden auf Heterozygotie in dem 
interessierenden cnromosdmaien mittels PCR-analysierter Mikro- 
sateiliterimarker, die die interessierenden Bereiche f lankie- 
ren, genetischen ahalysiert. Die fur diesen Bereich heterozy- 
gcten Tiere wurden dann fur die Erzeugung der nachsten Riick- 
kreuzungsgeneration angepaart. Fur den chromosomalen Bereich 
heterozygoten Tiere der 7 Ruckkreuzungsgeneration wurden dann 
untereinander (intercross) gekreuzt und erneut genetisch ana- 
lysiert. Zunachst wurden alle Tiere, die fur den interessie- 
renden chromosomalen Bereich hbmozygot fur Allele der SHR- 
Ratten waren, selektiert. Diese Tiere wurden dann erneut mit- 
tels 139 PCR-arialysierter Mikrosatellitenmarker, die etwa 96% 
des Gehoms der Ratte abdeckeh, genetisch charakterisiert . Tie- 
re, die dahh fur diese 139 Marker homozygot fur Allele der 
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BB/OK-Ratte waren, wurden fur die Etablierung (Founder) der 
kongenen Linien BB.SHR eingesetzt und phanotypisch charakteri- 
siert. 

Das Markerspekrum wurde erweitert, urn einerseits den geneti- 
schen BB/OK-Background abzusichern (s. Material&Methoden-Teil) 
und urn andererseits moglichst Rekombinationen in kleinen Be- 
reiche erkenneii zu konnen:D6Rat3-D6Ratl-D6woxl3-D6Ratl01- 
Ighe/Ckb-D6Mgh2-D6Rat94-D6Ratl83-D6Ratl0-D6Rat7-D6Rat75- 
D6Rat9-D6Rat6-D6Ratl60-D6Mgh9-D6Ratl84. 

Diese Linien wurden fur die Weiterzucht zwecks Miniraierxang der 
Diabetes -protektiven Region eingesetzt, Durch die Etablierung 
verschie'dener subkongener Linien (BB.6Sa-f) mit dem Phanotyp 
der BB.6S-Ratte, wurde der in Frage konimende chromosomale Be- 
reich auf < 2 cM ( 30-40 Gene) eingegrenzt. 

Kartierung des diabetesprotektiven Gens urn den Locus D6Mgh2. 
Tabelle 2: 



CM 




BB.6S 


BB. 6a 


BB. 6b 


BB. 6c 


BB. 6d 


BB. 6e 


BB. 




D6Mgh4 


BB 


BB 


BB 


BB 


BB 


BB 


BB 


2.1 




















D6Ratl3 


BB 


BB 


BB 


BB 


BB 


BB 


BB 


4.4 




















D6WOX5 


BB 


BB 


BB 


BB 


BB 


BB 


BB 


1.5 


D6Rat66 


BB 


BB 


BB 


BB 


BB 


BB 


BB 


2.0 


D6Ratl84/ 


SHR 


BB 


BB 


BB 


BB 


BB 


SHR 




D6Mgh9 


SHR 














0.8 


D6Rati60 


BB 


BB 


BB 


BB 


BB 


SHR 


1.3 


D6Rat6 . 


SiHR 


BB 


BB 


BB 


BB 


BB 


SHR 




D6Rat9 


SHR 


BB 


BB 


BB 


BB 


BB 


SHR 


0.4 


D6Rat75 


SHR 


BB 


BB 


BB 


BB 


BB 
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0.4 


D6Rat7 


SHR 


BB 


BB 


BB 


BB 


BB 


SHR 


2.1 


















D6Ratl0 


SHR 


BB 


BB 


BB 


BB 


BB 


SHR 


1.6 


D6Ratl83 


SHR 


BB 


SHR 


BB 


BB 


BB 


SHR 


0.4 


D6Rat94 


SHR 


BB 


SHR 


BB 


BB 


BB 


SHR 


1.9 


D6Mgh2 


SHR 


SHR 


SHR 


BB 


BB 


BB 


SHR 


1.7 


Ighe 
Ckb/ 

D6Ratl6l 


SHR 
SHR 


SHR 
SHR 


BB 
BB 


SHR 
SHR 


SHR 
SHR 


SHR 
BB 


SHR 


1.0 


D6Ratl 


SHR 


SHR 


BB 


BB 


BB 


SHR 


BB 


1.9 


















D6Rat3 


SHR 


SHR 


BB 


BB 


SHR 


SHR 


BB 




















Diabete- 
sinzidenz 


15% 


10% 


22% 


>50% 


>50% 


>50% 


14% 



2.1. Erzeugung weiterer kongener Linien 
BB . K (arlsburg) W (ild) R (atte') -Ratten 

Neben diabetesresistenten SHR-Ratten wurden auch Wildfangrat- 
ten zur Erzeugung von kongenen BB. K (arlsburg) W( ild) R (atte) - 
Ratten verwendet. Analog der BB.6S-Linie wurde der gleiche 
chromosomale Bereich der BB/OK von 15 cM durch den von Wild- 
fahgtieren ausgetauscht (BB.6W). 

siehe Herstellung kongener Ratten- Linien unter Punkt 2. 
3. Phanotypische Charakterisierung 

Die Korpermasse wurde von nichtdiabetischen Ratten in der 
zwolften Woche bestinunt. (Waage NAGEMA, VEB Wagetechnik Rapido, 
Wagebereich 1-lOOOg, e=0,lg).' 

ZusatzliGh wurden zu diesem Zeitpunkt die Blutglucose, das Se- 
niift Insulin, Plasma- Cholesterol und die Triglyzeride bestimmt. 
Blutproben wurde durch PUnktion des Augenplexsuses nach An- 
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astesie mit Isoflurane (Abbott, Wiesbaden, Deutschland) durch- 
gefuhrt. 

Die Blutfette wurden uber eine automatische Analyse (Roche 
Cobas Mira Plus, Roche, Schweiz) durchgef uhrt . 

Das ELISA-Verfahren (Rat Insulin ELISA, Mercodida AB, Uppsala, 
Schweden) diente zur Bestimmung der Serum- InSulin-Konzentrati - 
on. 

3.1. Diabetes inzidenz und Blutglukosebestirtimung 

Die Diabetesinzidenz der Starame wurde longitudinal in einer 
Inzucht generation ermittelt. Dazu wurde vom 50. - 200. Le- 
benstag zweitnal wochentlich mittels Teststreifen (Diaabur-Test 
5000, Bbehringer, Mannheim, Deutschland) auf Glukosurie gete- 
stet und im positiven Fall der Blutzucker bestimmt (Analyzer 
ESAT 6660-2, Priif geratewerk Medingen GmbH). Wenn innerhalb von 
2 Tagen zweimal eine Hyperglykamie (Blutglukose >15 mmol/1 
entspricht > 300mg/dl) nachgeWiesen wurde, galten die Ratten 
als diabetisch. 

.3.2. Lymphozyten- Phanbtyp 

Die Lymphozytenisolation von nichtdiabetischen Ratten erfolgte 
uber Dichtgradientenzentrifugation unter Nutzung von 
Histpaque-1083 (Sigma-Aldrich, Deiseiihofen, Deutschland) . 

Die Messumg erfolgte uber eine Zwei-Farben Immunf luoreszenz- 
Technik. (EPICS Profile II Flow Cytometer (Coulter, Hialeah, 
USA) . 
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Pur die Phanotypisierung wurde eine Mindestanzahl von 0,5 x 
106 Zellen festgelegt. Folgende mohoklonale Antikorper wurden 
benutzt : 



Zellen 


mAK 


Firma 


T- Zellen 


R73-FITC 


Medizinische Hochschule, Hannover, 
Deutschland 


T-Zellen 


3G2-FITC 


Medizinische Hochschule, Hannover, 
Deutschland 


B-Zellen 


0X33 -FITC 


Pharmigen, Heidelberg, Deutschland 


NK- Zellen 


10/78-FITC 


Pharmigen, Heidelberg, Deutschland 


TH-Zellen 


W3/25-FITC 


Serotec, Eching, Deutschland 


Ts/c-Zellen 


341-FITC 


Pharmigen, Heidelberg, Deutschland 


akt .T- Zellen 


OX39-PE 


Pharmigen, Heidelberg, Deutschland 


TH1 / TH2 - 1 ike 
Zellen 


OX-22-PE 
W3/25-FITC 


Pharmigen, Heidelberg, Deutschland 
Serotec, Eching, Deutschland 



3.3. Blutdruck 



Der systolische Blutdrtick wUrde im Alter von 12 bis 14 Wochen 
zwischen 9.00 bis 11.00 Uhr iiber die Schwanz-Methode gemessen 
(Kent Scientific Corporation, Kent, England) . Drei separate 
Punkte wurden benutzt, urn einen Endwert zu erhalten. 

4. Statistische Analyse 

Die Berechnung der Mittelwerte land der Standardfehler (SD) er- 
folgte mit dem Statistikprogramm SPSS. Die Signif ikanzen wur- 
den mittels ANOVA Analyse berechriet. 
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5. Molekularbiologische Methoden 

5.1. Isolierung Langerhansscher Inseln des Pankreas 

Die Isolierung der Langerhanschen Inseln erfolgte mittels 
Kollagenaseverdau (Biochrom) und Dextran- 

Dichtegradientenzentrifugation (Dextran, Fluka, Schweiz) . Es 
wurden mindestents 3 und maximal 15 Pankreata pro Kollagenase- 
verdau eingesetzt. 

Nach Entnahme der Pankreata wurden diese in die Kollagenaselo- 
sung (30 mg Kollageriase (Biochrom) gelost in 40 ml Hank's 
Salzlosurig (Sigma) bei 37 °C fur 10 min) uberfiihrt und mittels 
Handschiitteln verdaut. AnschlieSend wurde mit Hanks' Sal zlosung 
das Inselsediment dreimal gewascheri. Nach Abzentrifugation der 
Inseln (1900 U/min) wurde der Uberstand dekantiert und mit 
Dextranlosung (11 g Dextran/39 mi Hank's Salzlosung) aufgewir- 
belt. Die Inselemulsion wurde anschlieSend mit 3 weiteren 
Dichtegradienten von jeweils 4 ml uberschichtet . Nach 20- 
minutiger Zentrifugation (1900 U/min) erfolgte die Handlesung 
d£f Inseln unter dem Mikroskop. Zur Genexpressionsanalyse wur- 
den jeweils 500 Langerhanssche iriseln eingesetzt. 

5.2. DNA-Isolierung 

Die Isolierung der genomische DNA aus Lebergewebe wurde nach 
Vorschrift des Herstellers (Wizard ®, Genomic DNA Purification 
Kit , Promega) durchgef iihrt . 
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5.3. RNA-Isolierung aus Geweben 

Die RNA-Isolierung erfolgte nach den Angaben des Herstellers 
(RnEasy Mini Kit, Qiagen) . 

5.4. RT-PCR 

Die Umschreibung der RNA in ssDNA (cDNA) erfolgte mit dem Re- 
versen Transcription System der Firma Promega. 

Fur die Umschreibung wurde die RNA-Konzentration (Photometer, 
Eppendorf) auf 1,5 /ig eihgestellt. 

Die 1,5/ig RNA wurden mit i/il Random- Hexamerprimer (Promega) 
versetzt und anschliefiend auf 13,5/il Endvolumen mit Rnase 
freiem Wasser (Promega) aufgefullt. AhschlieSend wurde dieser 
RNA-Mix fur 5 min bei 65 °C erhitzt und danach auf Eis fur eine 
Minute abgekuhlt. Nach Zugabe des RT (Reverse Transkriptase) - 
Mixes (6,5 /zl) erfolgte die Umschreibung im Cycler (Thermocy- 
cler, Techne, Cambridge) nach folgendem Programm: 
50 min 42°C 
io min 70°C 



RT-Mix enthalt; 



Volumen 


Komponenten 


Firma 


+ 4/zl 
+ 1/xl 
+ 0,5/il 
+ 1/il 


5x MMLWPuffer 
lOmM dNTP's 
rRNasih 

MMLV-Reverse Trariskritase 


Promega 
Promega 
Promega 
Promega 


6,5/il 


Endvolumen 





Nach Beendigung des Cycler-Programmes wurde die ssDNA mit 50/zl 
bide'st -Wasser versetzt. 
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Die ssDNA wurde fur die Express ions studien sowie fur die Se- 
quenzierung genutzt. 

5.5. Sequenzierung von YY1 

Zur Sequenzierung des Gens wurde genomische DNA aus Lebergewe- 
be (Wizard ®, Genomic DNA Purification Kit, Promega) und RNA 
aus isolierten Langerhansschen Inseln, Pankreas, Leber und Ge- 
hiirn der BB/OK-, SHR- und BB.6S-Ratte gewonnen (Rneasy Mini 
Kit, Qiagen) . RNA wurde dann in ssDNA bzw. cDNA (siehe Pkt. 
5.4) nach Angaben des Herstellers utngeschrieben (Reverse Tran- 
scription System, Promega) . Sowohl genomische als auch cDNA 
wurde mittels PCR (Einsatz von GeneAmp® High Fidelity PCR Sy- 
stem, Applied BioBiosystems) unter Verwendung verschiedener 
Primer so amplif iziert, daS uberlappende Genprodukte zur Se- 
quenzierung zur Verfugurig standen (vgl. Fig. 11; Promotor: 
K823-F/K825-R*; Promotor und Exon 1: K884-F/K806-R; Exon 1: 
K801-F/K804-R; K814-F/KK832-R* ; Exoh 2 und 3: K828-F/K833 -R; 
K831-F/K817-R; Exon 4: K815-F/K870-R; K815-F/K818-R; K816- 
F/K819-R; K834-F/K836-R) . Die PCR wurde wie folgt durchge- 
fiihrt: 3min 94 °C, gefolgt von 35 Zyklen a 30sec 94 °C, 1 min 
55 oder 60 °C (*) , 45 sec 72 °C mit anschlieSender Elongation 
von 3min bei 72 °C. 

Die amplif izierten Genprodukte wiirden nach Reinigung mit Ami- 
con®Microcon-PCR-Zentrifalf iltern (Millipore, USA) fur die Se- 
quenzier-PCR verwandt. Die gefeinigten PCR-Produkte (250 ng) 
wurden unter Verwendung von ABIPRISM® BigDye Terminators v3.0 
Cycle Sequenzing Kit " nach Vorschrift des Herstellers (Applied 
Biosysteiris) amplif iziert (25 Zyklen: 10 sec. 96 °C, 4 min 
60°C) . Die amplif izierten Genprbdiikte wurden anschlieSend mit 
Alkohol gefallt, getrbckhet, in Formamid (4 fil) und Loading 
Buffer (i/xl) aufgenomriien, 2 min bei 90 °C denaturiert und da- 
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nach rait dem ABI PRISM® 377 (Applied Biosystems) sequenziert. 
Die Sequenzauswertung, einschlieSlich der Erstellung der Pro- 
teinsequenz erfolgte mit der Sequenzanalysesystemsof tware 
V3.4.1 (Applied Biosystems, USA). Die Genprbdukte wurden wie- 
derholt sequenziert und analysiert, urn Artefakte ausschlieSen 
zu konnen. 

Die Prufung der Sequenz mit der Genbank erfolgte online 
(www.ncbi.nlm.nih.gov/BLAST) . 

5.6. Eluierung der zweiten Bande bei BB.6S 

Es wurde nach der gelelektrophoretischen Auftrennung die zwei- 
te Bande (Panklireas, Leber, Gehirn) herausgeschiiitten Urid mit 
dem Wizard®PCR Preps DNA Purification System der Firma Promega 
eluiert. Nach Amplif izieruiig mit den Primern K831-F/K870-R er- 
folgte die Sequenzierung am ABI PRISM® 377 (Applied BioBiosy- 
s terns (vgl. Fig. 12 und SEQ ID NO: 7). 

5.7. Genexpressiorisstudien 

Aus gewormeher RNA von isolierten Larigerhansschen Inseln, Pan- 
kreas, Leber, Gehirn, Thymus und Milz von 8 Tage alten Ratten 
der. Inzuchtstamme BB/OK, SHR, BB.6S und LEW („unbelastete w 
Kontrolle) erfolgte die Umschreibung in ssDNA (siehe Punkt 
5.4). Die optimalen PCR-Bediiigungen wurden fur jedes Primer- 
paar unter Verwendung von ssDNA diabetes -resistenter LEW- 
Ratten erarbeitet. Als Kontrollsituation (housekeeping gene) 
wurde die Genexpression von GAPDH zugrunde gelegt. Gewebsspe- 
zifische cDNA wurde mit den Primern fur GAPDH (F: 
5 1 TCCCTCAAGATTGTCAGC^3 ' ; R : 5 % AGATCGACAAACGGATACATT3 x , Pro- 
duktgroSe = 30'8bp) und den YYl-Primern K601-F/KK804-R (Exon 1) 
und K831-F/K8818-R bzw. K831-F/K870-R (Zinkfinger) amplif i- 
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ziert. Die Geiiprodukte wurdeh gelelektrophoretisch aufgetrennt 
und die Express ions starke zwischen den Stammen unter Beriick- 
sichtigung von GAPDH und Nutzung des Typhoon 8600 Variable Mo- 
de Integer (Amersham- Pharmacia Biotech, U.K.) quantif iziert . 



5.8 RNA-Isolierung aus EDTA-Blut 



Produkt 


Firma 


QIAamp^ RNA Blood Mini Kit 


QIAGEN 


zusatzliche Nutzung von: 


Produkt 


Firma 


QIAshredder 


QIAGEN 


RQl-RNase free DNase 


Promega 



- eiusfuhrliche Anleitung im mitgelieferten QIAGEN 
Mini Handbook 

6. Feinkartierung von YY1 (Sicherstelluiig, dass YY1 in dem 
diabetesprotektiveh Bereich liegt) 

Die Feinkartierung erfolgte mit Hilfe der Maus-Gensequenz . 
Anhand dieser Gensequenz kbrihten Primer hergestellt werden. 

7. Prufung des Polymorphismus im Intron 3 unter Nutzung wei- 
terer Ratten- Stamme 

Dazu wurden folgende Stamme, die unter gleichen Bedingungen 
wie BB . 6S gehalten werden, beriutzt : 2 Wildf angtiere (Wildtyp, 
M+W) , jeweils 1 Tier voh diabetes-resistenten, ingeziichteten 
DA/K, BN/Mol, LEW/K und WOKW-Ratten. 
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8. Weitere Untersuchungen in vitro 

Morphologische Untersuchungen des Pankreas von normo- 
glykamischen BB/OK- und BB.6S~Ratten (Lucke, S., Kloting, 1. , 
Pusch, A. , Heinrich, H.W. and H.J, Hahn. Endocrine pancreas 
histology of congenic BB-rat strains with reduced diabetes in- 
cidence after genetic manipulation on chromosomes 4, 6 and X. 
Autoimmunity 36, 2003, 143-149). 

Untersuchungen an isolierten Langerhansschen Inseln von BB/OK- 
und BB. 6S- Ratten durch Variation der Ca-Konzentration im Kul- 
tiirmedium . 

Calbindin-D28k Proteinexpressibn mittels Westernblotanalyse 
unter Basalbedingungen und mit zunehmender Ca-Konzentration im 
Medium . 

9. Weitere Untersuchungen in vivo 

Untersuchungen zur Frakturheilung bei BB/OK- und diabetes - 
iresistehteh LEW. 1A-Ratt"en (38) . 

BB/OK und BB.6S-Ratten wurden mit Standarddiat (0,8% Ca) , mit 
Ca-reicher (2%) und Ca-armer Diat (0,4%) ernahrt (hergestellt 
von Ssniff R-Zucht, Spezialitaten GmbH, Soest) und bis zur 30. 
Lebenswdche auf Diabetesentwicklung beobachtet (nicht publi- 
ziert) . 

Verabreichung von Ca-Kanal-Blockern oder verschiedenen Ca- 
Antagonisten (Quercitin) . (nicht publiziert) 
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10- Primerbedingungen bei der Sequenzierufig 

Fur alle Primer gelten folgende Bedingtingen : 

Denaturierung: 3 min 94 °C 
Annealing: 35 Zykleil a 30seb 94°C 

1 min 55 Oder 60 °C (*) 
45 sec 72 °C 
Elongation: 3 min bei 72 °C. 



11 . Mikrosatellitenmarker 



Chr. 


Intern 


Marker 


Gesamt 


1 


R152 


Igf2 




1 


K6 


DlMghlO 




1 


K7 


DlMghl2 




1 


K57 


DlMgh7 




. 1 


K58 


DlMit3 




1 


K109 


DlMgh6 




1 


K13 6 


DlMgh4 




1 


K220 


DlMghl8 




1 


K228 


DlMghl4 




1 


K524 


DlRat249 




1 


K526 


DlRatl67 




1 


K533 


DlRat60 




12 


2 


K110 


D2Mit8 




2 


Kill 


D2Mgh9 




2 


Ki38 


D2Mitl 




2 


K139 


D2Mit4 




2 


K140- 


D2Mitl5 




2 


K230 


D2Mghl4 




2 


K238 


D2Mit7 




2 (5) 


K280 


t)5Mgh7 . 




2 


K374 


D2WOX8 




2 


K376 


D2WOX34 




2 


K384 


D2Woxl 




11 


3 


R142 


Svs2p 




... . 3 


K63 


D3Mitl 




3 


K66 


D3Mghll 




3 


K68 


D3MitlO 




3 


K386 


D3Woxi 




3 . ' 


K393 


D3WOX16 




3 


K395 


D3WOX25 





7 
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4 
4 


R88 
K147 


11-6 
Eno 




4 


K215 


Nbs 




4 


K253 


D4Mit9 




4 


K262 


D4Mitl6 




4 


K264 


D4Mgh9 




4 


K267 


D4Mghll 




4 


K547 


D4Rat9 




8 


5 


R44 


A2ug 




5 


Cjun 


Cjun 




5 


K72 


D5Mghl5 




5 


K151 


D5Mgh5 




5 


K270 


D5Mghl 




5 


K404 


D5Wox26 




5 


K412 


D5Woxl7 




7 


6 


R99 


Ckb 




6 


K73 


D6Mgh4 




6 


K74 


D6Mit5 




6 


K154 


D6Mitl 




6 


K155 


D6Mgh5 




6 


K156 


D6Mit4 




6 


K158 


D6Mit9 




6 


K159 


D6Pasl 




6 


K284 


D6Mgh2 




6 


K288 


D6Mit8 




6 


K289 


D6Mit2 




6 


K290 


D6Mit3 




6 


K416 


D6Wox2 




6 


K417 


D6Woxl7 




6 


K420 


D6WoxlO 




6 


K506 


D6Kyo4 




6 


K549 


D6Ratl84 




6 


K554 


D6Ratl60 




6 


K556 


D6Ratl01 




6 


K557 


D6Rat31 




6 


K625 


D6Rat 66 




21 


7 


K26 


D7Mit9 




7 


K77 


D7Mit7 




7 


K162 


D7Mgh7 




7 


-. K163 


D7Mgh9 




7 


K300 


D7Mitl6 




7 


K427 


D7WOX28 




7 


K428 


D7Woxl5 




7 . 


K435 


D7*fox2 




8 


8 


R102 


Apoc3 
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8 


K84 


D8Mit4 




8 


K116 


D8Mit2 




8 


K117 


D8Mghll 




8 


Kl 66 


D8Mgh4 




8 


K437 


D8WOX23 




8 


K444 


D8WOX12 




8 


K560 


D8Rat51 




8 


9 


R27 


Cryg 




9 


Inhb 


Inhb 




9 


K87 


D9Mitl 




9 


K88 


D9Mgh2 




9 


K171 


Aep2 




9 


K451 


D9WOX20 




9 


K453 


D9Mgh5 




7 


10 


R126 


Aep 




10. 


11-4 


11-4 




10 


K30 . 


D10Mgh2 '.. 




10 


K32 


DlOMitlO 




10 


K119 


D10Mgh6 




10 


K644 


D10Rat4 




10 


K646 


D10Rat8 




7 


11 


R22 


Stiist 




11 


K39 


DllMgh5 




11 


K91 


DllMit2 




11 


K120 


DllMgh3 




11 


K459 


DllWox4 




' 11 . 


K516 


DllRat22 




6 


12 


K42 


D12Mit5 




12 


K179 


D12Mit2 




12 


K182 


D12Mgh4 




12 


K183 


D12Mit4 




12 


K468 


D12WOX15 




5 


13 


Atpa 


Atpa 




13 


Kll 


D13UW 




13 


K93 


D13Mitl 




13 


K122 


D13Mgh8 




13 


K189 


D13Mgh7 










5 


14 


R40 


Alb 




14. 


R130 


Gck 




14 


K99 


D14Mgh2 




14 


K100 


•' D14Mghl 




14 


K128 


Csila 




14 


K130 


Dl4Mgh3 
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14 


K337 


t»14Mgh4 




14 


K584 


D14Rat65 




14 


K588 


D14Rat37 




9 


15 


K45 


D15Mgh3 




.15 


K102 


D15Mgh6 




15 


K123 


D15Mgh5 




15 


K482 


D15WOX5 




15 


K483 


D15WOX3 




5 


16 


K48 


D16Mgh4 




16 


K49 


D16Mit2 




16 


K170 


D9Mghl 




16 


K486 


D16WOX7 




4 


17 


K35 


D17Mgh3 




17 


K36 


D17Mgh5 




17 


K104 


D17Mit7 




17 


K105 


D17Mit5 




17 


K491 


D17WOX8 






18 


R66 


Olf 




18 


R98 


Gjai 




18 


Mit9 


D18Mit9 




18 


K12 


D18Mgh3 




18 


K202 


D18Mit4 




18 


K511 


. D18Kyol . 




18 


K559 


D18Rat44 




7 


19 


K206 


D19Mit7 




19 


K569 


D19Ratl2 




19 


K572 


D19Rat3 




19 


K575 


D19Rat34 




4 


20 


R145 


Tnf 




20 


K108 


D20Mghl 




20 


K127 


Prkacn . 




3 


X 


Mgh3 


DXMgh3 




X 


K15 


DXMghl 




X 


R87 


Pfkfb 




X 


R47 


Ar 




X 


K657 


DXRatl7 




X 


K654 


DXRatl9 




X 


K661 


DXRatl03 




X 


K661 


DXRatl03 




X 


K364 


DXWOX29 




X 


K352 


DXWOX17 




X 


K359 


DXWOX24 
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11 
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Fatentanspruche ; 

1. Protein, dadurch gekennzeichnet, daS es die in SEQ ID NO: 4 
dargestellte Aminosauresequenz aufweist. 

2. Protein, das ein Homologes des Proteins nach Anspruch 1 
ist und eine zu der in SEQ ID NO: 4 dargestellten Sequenz 
homologe Aminosauresequenz aufweist, dadurch gekennzeich- 
net, dass das Protein an Position 303 Arginin und an Posi- 
tion 311 Lysin aufweist. 

3. Protein nach Ailspiruch 2, das einen Homologiegrad von min- 
destens 95% aufweist. 

4. Protein nach Anspruch 3, das einen Homologiegrad von min- 
destens 97% aufweist. 

5. Protein nach Anspruch 3 oder 4, das einen Homologiegrad 
von mindestens 99% aufweist. 

6. Peptid, dadurch gekennzeichnet, dass es ein Fragment des 
Proteins nach den Anspruchen 1 bis 5 ist und eine Ami- 
nosauresequenz aufweist, die den die Atninosaurepositionen 
303 und 311 in SEQ ID NO: 4 umfassenden Sequenzbereich ent- 
halt. 

7. Peptid nach Anspruch 6, dadurch gekennzeichnet, dass es 
eine Lange von 53 bis 315 Aminosauren aufweist. 

8. Nuklfcinsaure, dadurch g&keiinzeichnet, dass sie ein fur ein 
Protein oder ein Peptid nach den Anspruchen 1 bis 7 kb- 
diert . 



WO 2004/056857 



PCT/EP2003/014762 



95 

9. Nukleinsaure nach Anspruch 8/ dadurch gekennz eichnet, dass 
sie die in SEQ ID NO: 3 dargestellte Nukleinsauresequenz 
auf weist . 

10. Nukleinsaure nach Anspruch 8, dadurch gekennzeichnet, dass 
sie eine Nukleinsauresequenz auf weist, die den die Nu- 
kleinsaurepositionen 979-981 und 1003-1005 in SEQ ID NO: 3 
umfassenden Sequeiizbereich enthalt. 

11. Antikorper, der gegen ein Protein oder Peptid nach den An- 
spriichen 1 bis 7 gerichtet ist. 

12. Antikorper nach Anspruch 11, dadurch gekennz ei chile t, dass 
er ein monoklonaler oder polyklonaler Antikorper ist. 

13. Verfahren zur Bestimmung der Neigung, an Typ-1 -Diabetes zu 
erkranken, dadurch gekennzeichnet, dass man genomische DNA 
aus isolierten mononukleare Blutzellen amplif iziert, se- 
quenziert und man Anderungen oder Abweichungen der Nu- 
kleinsauresequenz, die fur ein Protein mit der in SEQ ID 
NO: 6 dargestellten Aminb.sauresequenz kodiert, bestimmt, 
wobei Abweichungen von Codohs (nicht-stille Mutationen) 
eine erhohte Neigung anzeigen, an einer Autoimmunerkran- 
kurig, Typ- 2 -Diabetes, Krebs oder Mineral- und Lipidstoff- 
wechselstorungen zu erkranken. 

14. Verfahren nach Anspruch 13, dadurch gekennz eichnet, dass 
man zur Ampiif ikation die Primer K815-F/K817-R; K815- 
F/K875; K82i-F/K817-R; K821-F/K870-R; K874-F/K870-R; 
K823-F/K825-R; K884-F/K806-R; K801-F/K804-R; K814-F/KK832- 
R; K828-F/K833-R; K831-F/K817-R; K815-F/K870-R; K815- 
F/K818-R; K816-F/K819-R; K834-F/K836-R, F15/R12; F15/R14; 
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F15/R13; F57/R16; F57/R20; F57/R21; F59/RR25; F59/RR30; 
F59/R33; . F95/RR34; F96/R39; F95/R48; F95/R50; F60/R7; 
F60/R8/ F60/R66/ F60/R67; F96/R76; F96/R77; F96/R81 
F96/R83; F33/R1; F33/R4; F33/R15; F39/R28; F40/R3; Oder 
F41/R5 verwendet. 

15. Verfahren ziir Bestimmung der Neigung, an Typ-l-Diabetes zu 
erkranken, dadurch gekennzeichnet, dass man RNA aus iso- 
lierten mononukleare Blutzellen oder Gewebsbiopsien iso- 
liert, amplifiziert und quantif iziert, wobei eine erhoh- 
te/vermiriderte Expression eine erhohte/verminderte Nei- 
gung, an Typ-l-Diabetes, Autoimmunerkrankungen im allge- 
meinen, Typ- 2 -Diabetes, Krebs oder Mineral- und Li- 
pidstoffwechselstorungeri zu erkranken, anzeigt. 

16. Verwendung eines Proteins oder Peptids nach den Anspruchen 
1 bis 7 zur Herstellung einer pharmazeutischen Zusammen- 
setzung. 

17. VerWendung einer Nukleinsaure nach den Anspruchen 8 bis 10 
oder eines Antisense-Oligonukleotids zu derselben zur Her- 
stellung einer pharmazeutischen Zusammensetzung. 

18. Pharmazeutische Zusammensetzung, die eine Nukleinsaure 
nach den Anspruchen 8 bis 10 oder ein Antisense- 
Oligonukleotid zu derselben enthalt. 

19. Pharmazeutische Zusammensetzung, die ein Protein und/oder 
ein Peptid nach. den Anspruchen 1 bis 7 enthalt. 

20. ZusammerisetziMg nach Jinspfuch 18 oder 19, dadurch gekenn- 
zeichnet, dass sie ferner pharmazeutiscih vertragliche 
Hilfs- und/oder Tragerstof fe enthalt. 
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21. Zusammensetzung nach den Anspruchen 18 bis 20, dadurch ge- 
kennzeichnet, dass die Zusammensetzung zur intravenosen 
Applikation formuliert ist. 

22. Transgener nicht-menschlicher Sauger, dadurch gekenn- 
zeichnet, daS dessen Keim- und somatische Zellen eine Nu- 
kleinsaure oder einen Nukleinsaureabschnitt enthalten, 
die/der fur ein Protein mit der in SEQ ID NO: 2 gezeigten 
Aminosauresequenz oder einer dazu homologen Aminosaurese- 
quenz mit eitiem Homblogiegrad von mindestens 95%, vorzugs- 
weise mindestens 97% und besonders bevorzugt mindestens 
99% kodiert, wobei die homologe Aminosauresequenz an Posi- 
tion 303 Methionin und an Position 311 Arginin aufweist. 

23. Transgener Sauger nach Anspruch 22, dadurch gekennzeich- 
net, dass er das Protein im Pankreas exprimiert. 

24. Sauger nach Anspruch 22 oder 23, dadurch gekennzeichnet , 
dass er eine Ratte ist. 

25. Verwendung eines trans'genen oder kongenen nicht- 
menschlicher Saugers, dessen Keim- und somatische Zellen 
eine Nukleinsaure oder einen Nukleinsaureabschnitt enthal- 
ten, die/der fur ein Protein mit der in SEQ ID NO: 2 ge- 
zeigten Aminosauresequenz oder einer dazu homologen Ami- 
nosauresequenz mit einem Homologiegrad von mindestens 95%, 
vorzugsweise mindestens 97% und besonders bevorzugt minde- 
stens 99% kodiert >. wobei die homologe Aminosauresequenz an 
Position 303 Methionin und an Position 311 Arginin auf- 
weist, zum Idehtifisieren Diabetes -protektiver Substanzen. 
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26. Verwendung nach Anspruch 25, dadurch gekennzeichnet, dass 
der Homologiegrad mindestens 97% betragt. 

27. Verwendung nach Anspruch 25 oder 26, dadurch gekennzeich- 
net, dass der Homologiegrad mindestens 99% betragt. 

28. Kit zur Durchfuhrung eines Verfahrens nach den Anspruchen 
13 bis 15. 
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Figur $ 



Sequenz- und Proteinvergleich 

BB-Ratte CCGCCTCCTCGCCCGCCCTCCCGCAGCCCAGGAGCCGAGGCTGCCGCGGCCGTGGCGGCG 
SHR-Ratte CCGCCTCCTCGCCCGCCCTCCCGCAGCCCAGGAGCCGAGGCTGCCGCGGCCGTGGCGGCG 
HOMO SAPIENS G^flC^^dGM§GCGGCCGTGGCGGCG 



GAGCCCTCAGCC ATG GCC TCG GGC GAC ACC CTC TAC ATT GCC ACG GAC GGC TCG GAG ATG 
GAGCCCTCAGCC ATG GCC TCG GGC GAC ACC CTC TAC ATT GCC ACG GAC GGC TCG GAG ATG 
GAGCCCTCAGCC ATG GCC TCG GGC GAC ACC CTC TAC ATS GCC ACG GAC GGC TCG GAG ATG 
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CAC 


GTC 


TGT 


GCA 


GA| 


TGT 


GGC 


AAA 


GCG 


TTC 


GTT 


GAG . 


L 


H 


T 


H 


G 


p 


R 


V 


H 


V 


C 


A 


E 


C 


G 


K 


A 


F 


V 


E 


L 


H 


T 


H 


G 


p 


R 


V 


H 


V 


c 


A 


E 


C 


G 


K 


A 


F 


V 


E 


L 


H 


T 


H 


G 


p 


R 


V 


H 


V 


C 


A 


E 


C 


G 


K 


A 


F 


V 


E 


AGC 


TCA 


AAG 


CTA 


AAA 


CGA 


CAC 


CAG 


CTG 


GTT 


CAT 


ACT 


GGA 


GAA 


AAG 


CCC 


TTT 


CAG- 


-GTAGAGC 


AGC 


TCA 


AAG 


CTA 


AAA 


CGA 


CAC 


CAG 


CTG 


GTT 


CAT 


ACT 


GGA 


GAA 


AAG 


CCC 


TTT 


CAG- 


GTAGAGC 


AGC 


TCA 


AAG 


CTA 


AAA 


CGA 


CAC 


CAG 


CTG 


GTT 


CAT 


ACT 


GGA 


GAA 


AAG 


CCC 


TTT 


CAG- 






S 


S 


K 


L 


K 


R 


H 


Q 


L 


V 


H 


T 


G 


E 


K 


P 


F 


Q 






s 


S 


K 


L 


K 


R 


H 


Q 


L 


V 


H 


T 


G 


E 


K 


P 


F 


Q 






s 


S 


K 


L 


K 


R 


H 


Q 


L 


V 


H 


T 


G 


E 


K 


P 


F 


Q 







CAGTTCCTGTTCCCCAAACTGCAAGCTAGGGTGCTGGTCAGGGTGGTTGATATCAAGCACTA 
GAGTTCCTGTTCCCCAAACTGCAAGCTAGGGTGCTGGTCAGGGTGGTTGATATCAAGCACTATGGGGCACCGGT 



TGGGGTATTTTATTCCCATCCCTCCTGTCTGCTTGGGTTCCTGGTTACTGCTCGGGACTGCAGGTGTTACAGAT 
TGGGGTATTTTATTCCCATCCCTCCTGTCTGCTTGGGTTCCTGGTTACTGCTCGGGACTGC^GGTGTTACAGAT 



GGGGGTGGAGGGATTATGCGAAGCACCCCCACACTAAATTTCTAGCAGGTTT 
GGGGGTGGAGGG^TTATGCGAAGCACCCCCACACTAAAT^ 



TGTAGTGAGTAGTGTGTTGAATTACTGATAGAGTGCHTATAAGTGCTGTTGGCTACAGCTCCAGGTGACACTTG 
TGTAGTGAGTAGTGTGTTGAATTACTGATAGAGTGCTTATAAGTGCTGTTGGCTACAG 
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GTGCTGCTTATAGAAGAC^CGTGAGTTGACAGTTGGCATCACTAAATATCIT 
GTGCTGCTTATAGAAGAC^CGTGAGTTGACAGTTGGCATC^ 



AGAGTGTCTCTGAAAAGACTGAAGCTGTAAATTTGC 

AGAGTGTCTCTGAAAAC^CTCAAGCTGTAAATTTGCACTCAGCACAGCCCTTCTG 



GGGTTGTTAGTATCAGAGATCCCAGTGTGTCAGTTCTAAAATACCCTCA§^ 
GGGTTGTTAGTATCAGAGATCCCAGTGTGTCAGTTCTAAAATACCCTC^^ 



pfcTGCTCAGC^GAATAGTAGGTGGTTTCCATCT^ 
&^GCTCAGCAGtf^TAGTAGGTGGTTTCC^^ 



CAAGAGGGTTGATATCTGGTTTTTCCTTGACAG -TGC ACA 
CAAGAGGGTTGATATCTGGTTTTTC CTTGACAG -TGC ACA 



-TGC ACA 
C T 
C T 
C T 



TTC 


GAA 


GGC 


TGC 


GGG 


AAG 


CGC 


TTT 


TCA 


CTG 


GAC 


TTC 


AAT 


TTG. 


CGC 


ACG 


CAT 


GTG 


CGA ATC 


TTC 


GAA 


GGC 


TGC 


GGG 


AAG 


CGC 


TTT 


TCA 


CTG 


GAC 


TTC 


AAT 


TTG 


CGC 


ACG 


CAT 


GTG 


CGA ATC 


TTC 


GAA 


GGC 


TGC 


GGG 


AAG 


CGC 


TTT 


TCA 


CTG 


GAC 


TTC 


AAT 


TTG 


CGC 


*a 


CAT 


GTG 


jgGA ATC 


F 


E 


G 


C 


G 


K 


R 


F 


S 


L 


D 


F 


N 


L 


R 


T 


H 


V 




F 


E 


G 


C 


G 


K 


R 


F 


S 


L 


D 


F 


N 


L 


R 


T 


H 


V 


ft 1 


F 


E 


G 


C 


G 


K 


R 


F 


S 


L 


D 


F 


N 


L 


R 


T 


H 


V 


i 1 


CAT 


ACC 


GGA 


GAC 


AGG 


CCC 


TAT 


GTG 


TGC 


CCC 


TTC 


GAC 


GGT 


TGT 


AAT 


AAG 


AAG 


TTT 


GCT CAG 


CAT 


ACC 


GGA 


GAC 


AGG 


CCC 


TAT 


GTG 


TGC 


CCC 


TTC 


GAC 


GGT 


TGT 


AAT 


AAA 


AAG 


TTT 


GCT CAG 


CAT 


ACC 


GGA 


GAC 


AGG 


CCC 


TAT 


GTG 


TGC 


CCC 


TTC 


GAC 


GGT 


TGT 


AAT 


AAG 


AAG 


TTT 


GCT CAG 



H 


T 


G 


D 


R 


P 


Y 


V 


C 


p 


F 


D 


G 


C 


N 


K 


K 


F 


A 


Q 


H 


T 


G 


D 


R 


P 


Y 


V 


C 


p 


F 


D 


G 


C 


N 


K 


K 


F 


A 


Q 


H 


T 


G 


D 


R 


P 


Y 


V 


c 


p 


F 


D 


G 


C 


N 


K 


K 


F 


A 


Q 



TCA ACT AAC CTG AAA TCT CAC ATC TTA ACA CAC GCT AAA GCC AAA AAC AAC CAG TGA 
TCA ACT AAC CTG AAA TCT CAC ATC TTA ACA CAC GCT AAA GCC AAA AAC AAC CAG TGA 
TCA ACT AAC CTG AAA TCT CAC ATC TTA ACA CAC GCT AAA GCC AAA AAC AAC CAG TGA 



Zinkfinger * 



s 


T 


N 


L 


K 


S 


H 


I 


L 


T 


H 


A 


K 


A 


K 


N 


N 


Q 


* 


s 


T 


N 


L 


K 


S 


H 


I 


L 


T 


H 


A 


K 


A 


K 


N 


N 


Q 


* 


s 


T . 


N 


L . 


K 


s 


.. H 


I 


L 


T 


H 


A 


K 


A 


K 


N 


N 


Q 


* 



AAAGAAGAGAGAAGACCTTCTCGACCCCGGGAAGCCTCTTCAGGAGTGTGATTGGGAATAAATATGCCTCTC 
AAAGAAGAGAGAAGACCTTCTCGACCCCGGGAAGCCTCTTCAGGAGTGTGATTGGGAATAAATATGCCTCTC 
AAAGAAGAGAGAAGACCTTCTCGACCC-GGGAAGCCTCTTCAGGAGTGAGATTGGGAATAAATATGCCTCTC 



CTTTGTATATTATTTCTAGGAAGAATTTTAAAAATGAATCCTACACACTTAAGGGACATG 
CTTTGTATATTATTTCTAGGAAGAATTTTAAAAATGAATCCTACACACTTAAGGGACATG 
CTTTGTATATTATTTCTAGGAAGAATTTTAAAAATGAATCCTACACACTTAAGGGACATG 
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TTTTGATAAAGTAGTAAAAATTTAAAAAAATACTTTAATAAGATGACATTGCTAAGATGC 
TTTTGATAAAGTAGTAAAAATTTAAAAAAATACTTTAATAAGATGACATTGCTAAGATGC 
TTTTGATAAAGTAGTAAAAATTTAAAAAA-TACTTTAATAAGATGACATTGCTAAGATGC 

TCTATCTTGCTCTGTAATCTCGTTTCAAAAACAAGGTGTTTTTGTAAAGTGTGGCCCCAA 
TCTATCTTGCTCTGTAATCTCGTTTCAAAAACAAGGTGTTTTTGTAAAGTGTGGTCCCAA 
T^TATCTTGCTCTGTAATCTCGTTTCAAAAACAAGGTGTTTTTGTAAAGTGTGGTCCCAA 

CAGGAGGACAATTCATGAACTTCGCATCAA 

CAGGAGGACAATTCATGAACTTCGCATCAAAAGACAATTCT 

CAGGAGGACAATTCATGAACTTCGCATCAAAAGAC^ 

ATG 
ATG 
ATG 
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Pro t e inver gl e i ch 

BB 
SHR 

Homo sapiens 

masgdtlyiatdgsempaeivelheievetipvetiet^^ . 

masgdtlyiatdgsempaeivelheievetipvetiett^^ 

masgdtlyiatdgsei^aeivelheievetipvetiet^ 

^ppmialqplvtddptqvhhhqevilvqtreewggddsixslraedgfedq 
—Ippmialqplvtddptqvhhhqevilvqtreewggddsdglraedgfedqilip^ 

jj^PPMil^QPLVTDDPTQVHHHQEVTLVQTRE 

ssgggrvkkgggkksgkksylc^agaaggggadpgnkkwe^^ 
sggg^ssgggrvkkgggkksgkksylc^gagaaggggadpgnkkw 

SGGGjftSSGGGRVKKGGGKKSGKKSYLG^ 

QI IGENSPPDYSEYMTGKKLPPGGI PGIDLSDPKQLAEPARMKPRKIKEDDAPRTIA 
QI IGENSPPDYSEYMTGKKLPPGGI PGIDLSDPKQLAEFARMKPRKIKEDDAPRTIA 
QI IGENSPPDYSEYMTGKKLPPGGI PGIDLSDPKQLAEFARMKPRKIKEDDAPRTIA 

*Zinkfinger 

CPHKGCTKjaFRmSAN^KHLHTHGPRVHVC^ 

cphkgctkrfrdnsamjochl^^ 
cphkgctkMfrdnsai^khi^ 

Zinkfinger* 
tgdrpyvcpfdgcnkkfaqstnlkshilth 

TGDRPYVCPFDGCNKKFAQSTNLKSHILTH 
TGDRPYVCPFDGCNKKFAQSTNLKSHILTH 

AKAKNNQ* 
AKAKNNQ* 
AKAKNNQ* 



n=41l/414 
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gigur 11 



Yyl- Primer 



B e z e i chnuno 

Arf ^ Villi Wili^H 


Position 


XT X -LULGX OC^UCll^Ca 


K823-F (Promotor) 




CAC AGG CGT TTC TCG TCZV GAG 


K825-R (Promotor) 




AAT ACC AAC TCC TCA ACC CCG A 


K884-F 


-104 


CTT CCT CCC TCT GCC TTC CTtf 


K801-P 


55-75 


GAG ATC GTG GAA CTG CAT GAG 


K827-R 


127-150 


GTC TTC GTC GTC GTC CTC CTC CT^ 


K814-F 


417-437 


CGG AGA CGA CGA CTA CAT CGA 


K806-R 


42B-452 


GTG ACC AGC GTC TGC TCG ATG TAG T 


K804-R 


529-550 


CCA GGT AAC TCT TCT TGC CGP 


K805-R 


589-610 


G TT CCC ACT TCT TAT TAC CPG G 

w XX VvVmVm Jri\_ X X V. X J»JrvX X JtA — V»l.A7 v3f 


K828-P 


627-648 


CAA GAC CCT GGA GGG PGR GTT C 


K830-F 


697-721 


ACA GTG GTT GAA GAG CAG ATC ATT G 


K829-R 


690-722 


CCA ATG ATC TGC TCT TCA ACC AC 


K831-P 


839-866 


GCC AAG AAA AAT TAA AGA AGA TGA TGC j 


K832-R 


856-881 


GCT ATT GTT CTT GGA GCA TCA TCT TC 


K815-F 


997-1021 


GAG AGC TCA AAG CTA AAA CGA CAC C 


K833-R 


1026-1050 


AAA GGG CTT TTC TCC AGT ATG AAC C 


K817-R 


1077-1099 


AAT TGA AGT CCA GTG AAA AGG GC 


K816-F 


1105-1126 


ACG CAT GTG CGA ATC CAT ACC G 


K870-R 


1346-1372 


CAA AAC ATG TCC CTT AAG TGT GTA GGA j 


K818-R 


1501-1528 


AAT TGT AAG CAA CAG GTG AGC TTC ATG | 


K821-F (Intron 3) 




GCG AAG CAC CCC CAC ACT AAA TTT C 


K874-F (Intron 3) 




GCT TAT AAG TGC TGT TGG CTA CAG CT j 


K875-R (Intron 3) 


| GTC ACC TGG AGC TGT AGC CAA C 



PI 


10 


1 


TCACTGGACTTCAATTTGCGC 


(1084) 


F2 


12 


1 


TTTTCACTGGACTTCAATTTGCG 


(1081) 


P3 


12 


1 


ACCAGATCCTCATTCCGGTACC 


(383) 


P4 


14 


1 


CCCTTTCAGTGCACATTCGAA 


(1045) 


F5 


15 


1 


GACGACGAAGACGACGAGGAT 


(139) 


F6 


17 


1 


GAGAGCTCAAAGCTAAAACGACACC 


(997) 


F7 


19 


1 


GGAGACGACGACTACATCGAGC 


(418) 


F8 


22 


1 


CGGAGACGACGACTACATCGA 


(417) 


P9 


23 


1 


TGAGAGCTCAAAGCTAAAACGACAC 


(996) 


F10 


24 


1 


GAGGACCAGATCCTCATTCCG 


(379) 


Fll 


26 


1 


AACTCCCTCCTGGAGGGATACC 


(767) 


F12 


27 


1 


GAGACGACGACTACATCGAGCAG 


(419) 


F13 


29 


2 


GAGGAGGACGACGACGAAGAC 


(130) 


F14 


30 


1 


TTGAGAGCTCAAAGCTAAAACGACA 


(995) 


F15 


30 


1 


ACCCTCTACATTGCCACGGAC 


(16) 


F16 


30 


1 


ACTACATCGAGCAGACGCTGGT 


(428) 


F17 


34 


1 


GAGCTCAAAGCTAAAACGACACCA 


(999) 


F18 


35 


1 


TTCAGTGCACATTCGAAGGCT 


(1049) 


F19 


36 


2 


TGGAGACTATCGAGACCACGGT 


(98) 


F20 


37 


1 


TTTCAGTGCACATTCGAAGGC 


(1048) 


F21 


39 


1 


GTGCGAATCCATACCGGAGAC 


(1111) 


F22- - 


•■ 41 


• 1- 


GAGGTGATTCTGGTGCAGACG 


(301) 


F23 


41 


1 


ACTCCCTCCTGGAGGGATACCT 


(768) 


F24 


41 


2 


GTGGAGACTATCGAGACCACGG 


(97) 


F25 


41. 


1 


AGAGGTGATTCTGGTGCAGACG 


(300) 


F26 


42 


1 


TGAAATCTClACATCxTAACACACGCT 


(1190) 


F27 


43 


2 


TACATCGAGCAGACGCTGGTC 


(430) 


F28 


43 


1 


ACGACTACATCGAGCAGACGCT 


(425) 


F29 


43 


1 


GAAACTCCCTCCTGGAGGGATAC 


(765) 


F30 


49 


1 


CTGCACAAAGATGTTCAGGGATAAC 


(897) 
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"CO 1 

r 31 


52 


1 


AAAACGACACCAGCTGGTTCATAC 


(1011) 


r 32 


r" ft 

52 


1 


TAAAACGACACCAGCTGGTTCATAC 


(1010) 


T?ft O 

r o 3 


C ft 

53 


1 


AGAAGAGCGGCAAGAAGAGTTACC 


(524) 


1? 


53 


1 


ACCTGA7VATCTCACATCTTAACACACG 


(1187) 


rob 


53 


1 


CCTGAAATCTCACATCTTAACACACG 


(1188) 


f JO 


55 


1 


GACACCAGCTGGTTCATACTGGA 


(1016) 




55 


2 


GGTGGAGACTATCGAGACCACG 


(96) 


r 3 o 


55 


1 


AGACGACGACTACATCGAGCAGA 


(420) 


r j" 


C ft 

57 


1 


CAGTGGTTGAAGAGCAGATCATTG 


(698) 


T?A A 

±7^t U 


C ft 

5 / 


1 


ACAGTGGTTGAAGAGCAGATCATTG 


(697) 


"OA T 
if 4 1 


57 


1 


GGTTGAAGAGCAGATCATTGGG 


(702) 




58 


1 


GGTCCCAGAGTCCACGTCTGT 


(952) 






1 


TGCACAAAGATGTTCAGGGATAACT 


(898) 




C A 

bO 


1 


GATGCTCCAAGAACAATAGCTTGC 


(862) 






1 


GTCCCAGAGTCCACGTCTGTG > 


(953) 


Jt? *t o 


b / 


1 


GCTTTTCACTGGACTTCAATTTGC 


(1079) 


T7A "7 


b / 


1 


AGTGGTTGAAGAGCAGATCATTGG 


(699) 


T?A a 


b / 


1 


GTGGTTGAAGAGCAGATCATTGG 


(700) 




/l 


1 


AGAGCGGCAAGAAGAGTTACCTG 


(527) 


t?c n 


*7 1 


1 


TCACATCTTAACACACGCTAAAGCC 


(1197) 


r o± 


ft ft 


1 


ATCTCACATCTTAACACACGCTAAAGC 


(1194) 


r oz 




1 


CTGAAATCTCACATCTTAACACACGC 


(1189) 


nrn 

r jj 


ft A 

74 


1 


ACGACACCAGCTGGTTCATACTG 


(1014) 


PC /I 


ft /7 

7b 


1 


AGATATTGACCATGAAACAGTGGTTGA 


(681) 




76 


1 


GATATTGACCATGAAACAGTGGTTGA 


(682) 


TOO 


ft /r 

7b 


1 


GAGGGATACCTGGCATTGACCT 


(779) 


«C ft 

F57 


77 


1 


AGACCATCCCGGTGGAGACTAT 


(86) 


pr ft 

roo 


78 


1 


GAAGAGCGGCAAGAAGAGTTACCT 


(525) 


F59 


78 


3 


GGAGACTATCGAGACCACGGTG 


(99) 


TTT /T ft 

FbO 


82 


1 


GGTTCGAGGACCAGATCCTCA 


(374) 


F61 


83 


2 


GAGCAGATCATTGGGGAGAACTC 


(709) 


r 62 


87 


1 


GAAGATGATGCTCCAAGAACAATAGC 


(856) 


r oj 


o o 

OO 


1 


CGCTAAAGCCAAAAACAACCAGT 


(1212) 


r b4 


88 


1 


ATACCGGAGACAGGCCCTATGT 


(1121) 


T7I/T C 

r bb 


B9 


1 


CAATAGCTTGCCCTCATAAAGGC 


(875) 


rob 


O ft 

89 


1 


AAGATATTGACCATGAAACAGTGGTTG 


(680) 


r b 7 


O ft 

89 


1 


ACAATAGCTTGCCCTCATAAAGGC 


(874) 


too 


a ft 
92 


1 


AGAAAAGCCCTTTCAGTGCACA 


(1038) 


r by 


ft c 

95 


-I 
1 


ATATTGACCATGAAACAGTGGTTGAAG 


(683) 


r /U 


ft c 

95 


1 


GCGGCAAGAAGAGTTACCTGG 


(530) 


r /I 


ft c 

95 


1 


TATTGACCATGAAACAGTGGTTGAAG 


(684) 


m ft 

F72 


95 


1 


ATTGACCATGAAACAGTGGTTGAAG 


(685) 


r /3 


95 


1 


TTGACCATGAAACAGTGGTTGAAG 


(686) 


Jb /4 


96 


1 


GAACAATAGCTTGCCCTCATAAAGG 


(872) 


r 75 


ft £7 

96 


1 


AGAACAATAGCTTGCCCTCATAAAGG 


(871) 


r /b 


98 


1 


ACCTCTCAGACCCCAAGCAACT 


(797) 


r / / 


99 


1 


ACGCTAAAGCCAAAAACAACCAG 


(1211) 




TAT 
101 


1 


AAGATGATGCTCCAAGAACAATAGCTT 


(857) 




TAT 
1U1 


1 


AAACGACACCAGCTGGTTCATACT 


(1012) 




1 AO 

LkjA 


1 


CGACGGTTGTAATAAGAAGTTTGCTC 


(1152) 


f Ol 


1 0"3 
1UJ 


1 


C-AAGAACAATAGCTTGCCCTCATAAA 


(869) 






1 
1 


CaUAAC^GAAGCAGGTGCAGATC 


(606) 




1 OA" 


n 
X 


A/iHHwr^UL 111 CAfci 1 GCACATTC 


(1040) 


F84 


1 fifi 

iwO 


o 


1 1 vjL. 1 Al vjfAUAAAuCATLTGCAC 


(922) 


F85 


106 


1 






F86 


106 


1 


TTCGACGGTTGTAATAAGAAGTTTGC 


(1150) 


F87 


106 


1 


AGCGTTCGTTGAGAGCTCAAAG 


(987) 


F88 


106 


1 


GCCCCTTCGACGGTTGTAATA 


(1145) 


F89 


107 


1 


CAACTGGCAGAATTTGCCAGA 


(814) 


F90 


107 


1 


AGTTCTCGGTCACCATGTGGTC 


(644) 


F91 


108 


1 


TGAGAAAGCATCTGCACACCC 


(929) 
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T7QO 

ryz 


1 AQ 


-i 
l 


ATGAGAAAGCATCTGCACACCC 


(928) 


c 2? J 


i n q 
lUo 




m TV |m/N« /-ttv tv tv /■*» /-tn mnm^l/ii> /"iTv ********* 

TATGAGAAAGCATCTGCACACCC 


(927) 


F94 


111 

1X1 


1 

JL 




/ CA "3 \ 

(643) 


F95 


111 


1 


CACCACCACCAAGAGGTGATTC 


(289) 


F96 


111 


1 


GACGACGACTACATCGAGCAGAC 


(421) 


F97 


112 


1 


CCCGGTGGAGACTATCGAGAC 


(93) 


F98 


112 


1 


CAGAAGCAGGTGCAGATCAAGAC 


(610) 


F99 


112 


1 


GCTAAAGCCAAAAACAACCAGTGA 


(1213) 


F100 


113 


1 


GACCTCTCAGACCCCAAGCAA 


(796) 



pi 


j 


i 
i 


GUAAAL i J. L iTATTAGAACCGTCGAA 


(1175) 


P9 


A 
*± 


i 
i 


AUA 1 AGGGLCTGTCTCCGGTAT 


(1142) 


P^ 


A 
** 


i 


AGCAAACTTCTTATTACAACCGTCGA 


(1176) 




o 


i 


AGCTTTGAGCTCTCAACGAACG 


(1010) 


XN.D 


Q 

o 


1 


/"i tv /™t /~i tv tv TV / u 1 u i i/^i mm tv mm tv /*nv tv n/*t/ i im/^/^ 

GAGCAAACTTCTTATTACAACCGTCG 


(1177) 


P£ 
AO 


Q 

o 


1 


/*ti i ii i ii i tv ri/^rnrtrrm tv tv r*tr*% tv tv on/vn 

CTTTGAGCTCTCAACGAACGCT 


(1008) 


P7 


Q 


1 


GGTTGTTTTTGGCTTTAGCGTGT 


(1231) 


"DQ 
Ko 


i n 
1U 


1 


CTGGTTGTTTTTGGCTTTAGCGT 


(1233) 




1 1 
11 


1 

1 


CCTGTCTCCGGTATGGATTCG 


(1134) 


K1U 


1 o 


1 


CTGTCTCCGGTATGGATTCGC 


(1133) 


PI 1 

All 


1 o 
12 


1 


GTCTCCGGTATGGATTCGCAC 


(1131) 


PI o 


1 o 


1 


AGCGTCTGCTCGATGTAGTCGT 


(446) 


D1 o 
Klo 


1 o 


1 


TTCTGTTCCCACTTCTTATTACCCG 


(614) 


K14 


15 


2 


TCTGCTCGATGTAGTCGTCGTCT 


(442) 


DIE 

Klb 


15 


1 


ACTGGTTGTTTTTGGCTTTAGCG 


(1234) 


TJ1 £ 

Klo 


16 


4 


GTCTGCTCGATGTAGTCGTCGTC 


(443) 


Kl / 


16 


4 


ATCCTCGTCGTCTTCGTCGTC 


(159) 


Klo 


1 T 


1 


CAGTATGAACCAGCTGGTGTCGT 


(1036) 




17 


1 


TTGAGCTCTCAACGAACGCTTT 


(1006) 


■Don 


19 


1 


AGACCACATGGTGACCGAGAAC 


(666) 


"DO 1 


19 


1 


CTTCTTATTACCCGGGTCGGC 


(603) 


R22 


20 


1 


CTGCTCGATGTAGTCGTCGTCTC 


(441) 


"DOT 


21 


1 


TCGATGTAGTCGTCGTCTCCG 


(437) 




o o 

22 


1 


- TTTGAGCTCTCAACGAACGCTT 


(1007) 


DOC 


22 


1 


CCACTTCTTATTACCCGGGTCG 


(606) 


XV D 




1 


v*At. 1 1 L 1 TArTACCCGGGTCGG 


(605) 


R97 




1 
1 


GAUUAGL.G 1L 1 GCTCGATGTA 


(450) 


R28 


9*3 


1 
1 


nnl loAA^lUv-AGlGAAAAGCGC 


(1099) 


R29 


9^ 


1 
1 


T^l 7A 7A PP 7\ PTP r 1 f/^ A'PTi'T'Ti 7V f* 

lV7i\AV M L M A.GClG^lGlCol 1 1 1AG 


(1031) 


R30 


23 


1 

J~ 




/ tz tz c \ 

(665) 


R31 


25 


1 


AACTTCTTATTACAACCGTCGAAGGG 


Mi 79\ 
V 11 f Z ) 


R32 


25 


1 


TGTTCCCACTTCTTATTACCCGG 


(611) 


R33 


26 


3 


CCCAGGTAACTCTTCTTGCCG 


(551) 


R34 


26 


1 


AGAGGTCAATGCCAGGTATCCC 


(802) 


R35 


26 


2 


CCAGGTAACTCTTCTTGCCGC 


(550) 


R36 


27 


1 


TTGAAGTCCAGTGAAAAGCGCT 


(1097) 


R37 


29 


1 


TGAGGATCTGGTCCTCGAACC 


(394) 


R38 


29 


1 


CACATGGTGACCGAGAACTCG 


(662) 


R39 


29 


1 


GTATGAACCAGCTGGTGTCGTTTT 


(1034) 


R40 


30 


1 


TCAATCTCATGCAGTTCCACGAT 


(80) 


R41 


" 30 " 


1 *' 


TCAATCTCATGCAGTTCCACGA 


(80) 


R42 


30 


1 


AGTATGAACCAGCTGGTGTCGTTT 


(1035) 


R43 


32 


1 


GGTCTCGATAGTCTCCACCGG 


(114) 


R44 


33 


1 


AAGACCACATGGTGACCGAGAA 


(667) 


R45 


33 


1 


CAATCTCATGCAGTTCCACGATC 


(79) 


R46 


34 


1 


GGAATGAGGATCTGGTCCTCG 


(398) 


R47 


34 


2 


TTCCCACTTCTTATTACCCGGGT 


(609) 


R48 


34 


2 


TGAAGTCCAGTGAAAAGCGCTT 


(1096) 


R49 


35 


1 


GCTCGATGTAGTCGTCGTCTCC 


(439) 



WO 2004/056857 



Flour 11-3. Fortsetzunq 



18/77 



PCT/EP2003/014762 

10/539535 



R50 


J o 


X 


CaTATGAA.CCAGCTGGTGTCGTTT^ 


(1034) 


R51 


•JC 
JO 


X 


TTCCCACTTCTTATTACCCGGG 


(609) 


R52 


AO 


X 


GAATGAGGATCTGGTCCTCGAAC 


(397) 


R53 


43 


X 


GAGGTCAATGCCAGGTATCCCT 


(801) 


R54 


44 


X 


GTGGTCTCGATAGTCTCCACCG 


(116) 


R55 


A A 


X 


AGGTAACTCTTCTTGCCGCTCTTC 


(548) 


R56 


4*? 

to 


X 


vJACJATT C TGC ACAG ACGTG GA 


(982) 


R57 


AG. 


X 


AAAGuGC TTTT C TC CAGT ATGAAC C 


(1050) 


R58 


4.7 


o 


AL.CJA1 CCxCGTCGTCTTCGTC 


(162) 


R59 


4R 


X 


UCTTCTGTTCCCACTTCTTATTACCC 


(616) 


R60 


ASK 


X 


CACATTCTGCACAGACGTGGAC 


(982) 


R61 




X 


CAGGTAACTCTTCTTGCCGCTCT 


(549) 


R62 


49 


X 


bATGCTTTCTCATAGCAGAGTTATCCC 


(940) 


R63 


49 


X 


CTGA4AGACCACATGGTGACCG 


(670) 


R64 


OK) 


o 

4& 


CCTGCTTCTGTTCCCACTTCTTATTAC 


(619) 


R65 




X 


ACCAGCGTCTGCTCGATGTAGT 


(449) 


R66 


H3 


X 


TCTTATTACAACCGTCG4AAGGGG 


(1168) 


R67 


— > j 


*l 
X 


1 IGT 1 rTTGGCTTTAGCGTGTGTT 


(1229) 


R68 


54 


X 


AL ICjAAAGGGCTTTTCTCCAGTATG 


(1054) 


R69 


55 


X 


^T tv /*ifrn/*i TV TV TV ^t^t ^trnfftrnm/*<fTt/ , i 4^1 ^» m ^ 

LAL 1 vaAAAGGGCTTTTCTCCAGTAT 


(1055) 


R70 


57 


T 

X 


«aAUrv7 1 vdAU 1XL rcCCCAATGATC 


(736) 


R71 


58 


n 
j- 


V3v5 1 AL.CI3LJAAI C3AGGATCTGGT 


(404) 


R72 


62 


i 

X 


\a JL U J. v-vjAI AGTCTCCACCGGG 


(113) 


R73 




X 


CTTCAACCACTGTTTCATGGTC4?^ATA 


(709) 


R74 


64 

vt 


1 
X 


CCTTTATGAGGGCAAGCTATTGTTC 


(896) 


R75 

XV / J 


64 


X 


CTTCAACCACTGTTTCATGGTCAATAT 


(709) 


R76 

XV / U 


03 


X 


TTTTTGGCTTTAGCGTGTGTT4?^AGAT 


(1226) 


R77 


o o 


X 


TTGTTTTTGGCTTTAGCGTGTGTTA 


(1229) 


P78 


69 


1 
X 


CTTGGGGTCTGAGAGGTCAATG 


(813) 


R79 

XV / J 


71 


X 


GTCCGTGGCAATGTAGAGGGT 


(36) 


R80 


71 


X 


TCTGGCAAATTCTGCCAGTTG 


(834) 


Rfll 

XV Q X 


70 


X 


TCACTGGTTGTTTTTGGCTTT4?\GC 


(1236) 


R82 


70 


1 

X 


CTTTGTGCAGCCTTTATGAGGG 


(906) 


R83 


73 


X 


GTTGTTTTTGGCTTTAGCGTGTGT 


(1230) 


R84 


74 


X 


TG4AAAGGGCTTTTCTCCAGTATGA 


(1052) 


R85 


7c 

/ 3 


X 


GCAAGCTATTGTTCTTGGAGCATC 


(885) 


R86 


76 


X 


GCCTTTATGAGGGC4?^AGCTATTG 


(897) 


R87 


76 


X 


GCTTGGGGTCTGAGAGGTCAAT 


(814) 


R88 


76 


X 


CCAATGATCTGCTCTTCAACCAC 


(722) 


R89 


7 7 


X 


CCACCGTGGTCTCGATAGTCTC 


(121) 


XV -7 \J 


"7 Q 
/ O 


X 


CTGCTTCTGTTCCCACTTCTTATTACC 


(618) 


R91 

XV J J. 


o u 


1 

X 


TTGGCTTCATTCTGGCAAATTC 


(844) 


R92 




X 


CTTCAACCACTGTTTCATGGTCAAT 


(709) 


R93 

XV J J 


fil 

O X 


X 


AATCTCATGCAGTTCCACGATCTC 


(78) 


R94 


82 


1 


v_ x x v-Hfxrs.\».v - xi\ — 1U11X v*xii. ova X tnA 


(709) 


R95 


83 


1 


GGGCTTTTCTCCAGTATGAACCA 


(1047) 


R96 


83 


2 


ACCACATGGTGACCGAGAACTC 


(664) 


R97 


84 


1 


GTGCAGATGCTTTCTCATAGCAGA 


(945) 


R98 


* 84 


1 


TGTGCAGATGCTTTCTCATAGCAG 


(946) 


R99 


85 


1 


CATTCTGCACAGACGTGGACTC 


(980) 


R100 


85 


1 


TCTGAGAGGTCAATGCCAGGTATC 


(806) 
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Verkurzter Zinkfinger von BB.6S 



l. Nukleins&uresequenz des „verkurzten u Zinkfingers bei BB.6S (die 
durchgestrichenen Nukleotide fehlen, nur die unterstrichenen 
Nukleotide kodieren £\ir Aminosauren des Proteins in der zweiten 
Bande) 



1 ATGGCCTCGG GCGACACCCT CTACATTGCC ACGGACGGCT CGGAGATGCC 

51 AGCCGAGATC GTGGAACTGC ATGAGATTGA GGTGGAGACC ATCCCGGTGG 

101 AGACTATCGA GACCACGGTG GTGGGCGAGG AGGAGGACGA CGACGAAGAC 

151 GACGAGGATG GTGGCGGCGG AGACCACGGT GGCGGGGGCG GCCACGGGCA 

201 CGCTGGCCAC CACCATCACC ACCACCACCA CCACCACCCG CCCATGATCG 

251 CGCTGCAGCC GCTGGTCACC GACGACCCGA CCCAAGTGCA CCACCACCAA 

301 GAGGTGATTC TGGTGCAGAC GCGCGAGGAG GTAGTGGGTG GCGACGACTC 

351 GGACGGGCTG CGCGCCGAGG ACGGGTTCGA GGACCAGATC CTCATTCCGG 

401 TACCCGCGCC GGCCGGCGGA GACGACGACT ACATCGAGCA GACGCTGGTC 

451 ACCGTGGCGG CGGCCGGCAA GAGCGGTGGC GGGTCTTCGT CGGGCGGCGG 

501 CCGCGTTAAG AAGGGCGGCG GCAAGAAGAG cGGCAAGAAG AGTTACCTGG 

551 GCAGCGGGGC CGGCGCGGCG GGCGGTGGCG GCGCCGACCC GGGTAATAAG 

601 AAGTGGGAAC AGAAGCAGGT GCAGATCAAG ACCCTGGAGG GCGAGTTCTC 

651 GGTCACCATG TGGTCTTCAG ATGAAAAAAA AGATATTGAC CATGAAACAG 

701 TGGTTGAAGA GCAGATCATT GGGGAGAACT CACCTCCTGA TTATTCTGAA 

751 TATATGACAG GCAAGAAACT CCCTCCTGGA GGGATACCTG GCATTGACCT 

801 CTCAGACCCC AAGCAACTGG CAGAATTTGC CAGAATGAAG CCAAGAAAAA 

851 TTAAAGAAGA TGATGCTCCA AGA&CAATAG CTTGCCCTCA TAAAG GGgGe 

901 ACAAACAtCT TCAGCCATAA CTCTCCTATG AgAAACCATC TCCAGACCCA 

951 CGGTCCCAOA OTCCAGOTCT GTOCAGAATG TCCCAAAGCG TTCCTTCAGA 

1001 GCTCAAAGCT AAAACCACAC CACCTCGTTC ATACTGGACA AAAGCCCTTT 

1051 CAGTGCACAT TCGAAGGCTG CGGGAAGCGC TTTTCACTGG ACTTCAATTT 

1101 GCGCACGCAT GTGCGAATCC ATACCGGAGA CAGGCCCTAT GTGTGCCCCT 

1151 TCGACGGTTG TAATAAGAAG TTTGCTCAGT CAACTAACCT GAAATCTCAC 

1201 ATCTTAACAC ACGCTAAAGC CAAAAACAAC CAGTGA 



2 • Proteinsequenz des „verkurzten w Zinkfingers bei BB. 63 (die 
durchgestrichenen Nukleotide fehlen, nur die unterstrichenen 
Nukleotide sind in der zweiten Bande vorhanden) : 



C£HK g ctkmfrdnsamrkhlhthgprvhv 

caecgkafves s.ll krhqlv - ht g e - k p f q 

CTFEGCGKRFSLDFNLRTHVRIHTGDRPYV 
CPFDGCNKKFAOSTNTKSHTTTH 



n=57 
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Fig\iy 13 

Erfindungsgemafi verwendete Antisense-Oligonukleotide 

(Die angegebenen Positionen beziehen sich nur auf den kodierenden Bereich und 
entsprechen nicht den Positionsnummern im Sequenzprotokoll. ) 

>gi| 1835104 |emb|Z85393.l|HSZ85393 H. sapiens Ig lambda light chain variable 
region gene(34-30SWUE197) rearranged; Ig- Light -Lambda; VLambda 
Identities = 14/14 (100%) 

Query: 74 accggagcccgctg 88 

iiiiiiiiiniii 

Sbjct: 241 accggagcccgctg 228 
Vjregion 1..348 

>gi 1 14589948 1 ref |NM_000937 .2 1 Homo sapiens polymerase (RNA) II (DNA directed) 
polypeptide A, 220kDa (POLR2A) , mRNA 
Identities = 17/18 (94%) 

Query: 77 ggagcccgctgtgggaga 94 

llllllll lllllllll 

Sbjct: 5099 ggagcccggtgtgggaga 5082 
CDS 387.. 6299 

>gi | 18596386 | ref | XM_093190 . 1 | Homo sapiens similar to T-cell activation 
protein (LOC170226) , mRNA 
Identities = 20/21 (95%) 

Query: 76 cggagcccgctgtgggagatg 96 

llllll 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 156 cggagcacgctgtgggagatg 176 
CDS 1..1314 

>gi|793457l|gb|AF220152.2|AF220152 Homo sapiens TACC2 mRNA, complete cds 
Identities = 14/14 (100%) 

Query: 78 gagcccgctgtggg 91 

1 1 1 1 1 1 ] 1 1 i l ) ) I 

Sbjct: 977 gagcccgctgtggg 990 
CDS 293.. 3013 

>gi | 6165844 |gb|AF100772.l|AF100772 Homo sapiens tenascin-Ml (TNM1) mRNA, 
Identities = 16/16 (100%) 

Query: 79 agcccgctgtgggaga 94 

1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 4377 agcccgctgtgggaga 4362 

CDS 65 . . 8242 

functions "putative receptor molecule" 

>gi | 24496766 1 ref |NM_004712 . 3 | Homo sapiens hepatocyte growth factor- regulated 
tyrosine kinase substrate (HGS) , mRNA 
Identities = 15/15 (100%) 

Query: 79 agcccgctgtgggag 93 

MIMMMIIIIM 

Sbjct: 2088 agcccgctgtgggag 2074 
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CDS 78.. 2411 

/note= "human growth factor- regulated tyrosine kinase 

>gi|4324953|gb|AF114821.l|HSSM03 Homo sapiens smoothened (SMO) gene, exons 3 
through 12 and complete 
Identities = 14/14 (100%) 

Query: 79 agcccgctgtggga 93 

llllllllllllll 

Sbjct: 6838 agcccgctgtggga 6825 
CDS 6833.. 6967 

>gi 1 22064913 |.ref |XM_090047 .5 | Homo sapiens LOC160156 (LOC160156) , mRNA 
Identities = 14/14 (100%) 

Query: 80 gcccgctgtgggag 93 

iiiiiiiiiiiin 

Sbjct: 1427 gcccgctgtgggag 1440 
CDS 709.. 1980 

>gi|517388|emb|Z31606.l|HSB2NO3 H.sapiens brain-2/N-Oct 3 gene (promoter 
region) 

Identities = 15/15 (100%) 
Query: 80 gcccgctgtgggaga 94 

iiiiiiiiiniiil 

Sbjct: 547 gcccgctgtgggaga 561 
promoter 1. .670 

>gi|2327350l|gb|BC035782.l| Homo sapiens, Similar to tyrosine kinase, non- 
receptor, 1, clone 
Identities = 15/15 (100%) 

Query: 83 cgctgtgggagatgt 97 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1032 cgctgtgggagatgt 1046 
CDS 98.. 2083 

>gi | 7662017] ref |NM_015153.l| Homo sapiens PHD finger protein 3 (PHP3) , mRNA 
Identities = 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

iiiiiiiiiiiin 

Sbjct: 2228 gctgtgggagatgt ^2241 

CDS 28.. 6147 

>gi|20561197 | ref |XM_062302.3 | Homo sapiens similar to RING finger protein 18 
(Testis-specific ring-finger protein) (LOC120826) , mRNA 
Score = 28.2 bits (14), Expect = 119 
Identities = 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

iiiiniiiiiiii 

Sbjct: 489 gctgtgggagatgt 502 
CDS 190 . . 2244 

/products "similar to RING finger protein 18 (Testis-specific ring-finger rote in ) 

>gi | 4885330 | ref |NM_005305. 1 [ Homo sapiens G protein- coupled receptor 42 

(GPR42) , mRNA 

Identities = 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

llllllllllllll 

Sbjct: 486 gctgtgggagatgt 473 

CDS 1..1041 
>gi | 17473297 | ref |XM_061928 . 1 | Homo sapiens LOC120226 (LOC120226) , mRNA 



2 
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Identities = 14/14 (100%) 
Query: 84 gctgtgggagatgt 97 

II III II I III II! 

Sbjct: 453 gctgtgggagatgt 466 
CDS 1..492 

>gi 1 21359977 1 ref |NM_024947 . 2 | Homo sapiens polyhomeotic like 3 (Drosophila) 
(PHC3), mRNA 

Identities = 14/14 (100%) 
Query: 85 ctgtgggagatgta 97 

IMIMI Mill II 

Sbjct: 404 ctgtgggagatgta 391 

CDS 65.. 2959 

/notes "early development regulator 3; polyhomeotic 3" 

>gi|l971881l|gb|BC007249.2| Homo sapiens, pelota homolog (Drosophila), clone 
Identities = 13/13 (100%) 

Query: 97 taacggtgcctgc 109 

iiiiiniiiiii 

Sbjct: 1303 taacggtgcctgc 1291 

CDS 274.. 1431 

/product- "pelota homolog (Drosophila)" 

>gi 1 19924298 | ref |NM_004958 .2 | Homo sapiens FK506 binding protein 12-rapamycin 
associated protein l(FRAPl), mRNA 
Identities = 13/13 (100%) . 

Query: 98 acggtgcctgccg 111 

iiiiiniiiiii 

Sbjct: 5720 acggtgcctgccg 5732 

CDS 80.. 7729 

/note="FK506 binding protein 12-rapamycin associated protein 2; rapamycin target 
protein; FKBP12 -rapamycin complex -associated protein 1; FKBP - rapamy c in 
associated 

>gi 1 22049727 | ref |XM_040948 .8 | Homo sapiens dynein, cytoplasmic, heavy 
polypeptide 1 (DNCH1) , mRNA 
Identities = 13/13 (100%) 

Query: 99 acggtgcctgccg 111 

[ 1 1 M 1 1 1 1 1 1 1 1 

Sbjct: 6291 acggtgcctgccg 6303 

CDS 6.. 6830 

/product= "similar to cytoplasmic dynein heavy chain" 

>gi|459833|gb|L25085.l|HUMSEC61B Human Sec61-complex beta-subunit mRNA, 
Identities = 14/14 (100%) 

Query: 100 cggtgcctgccgag 113 

1 1 1 1 1 1 ! I M I M I 

Sbjct: 220 cggtgcctgccgag 207 

CDS 64.. 354 

/functions "protein translocation across the er-membrane" 

>gi | 21704280 | ref |NM_020433 .2| Homo sapiens junc tophi 1 in 2 (JPH2) , mRNA 
Identities = 17/18 (94%) 

Query: 100 cggtgcctgccgagcctc 117 
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minim linn 

Sbjct: 2526 cggtgcctgcagagcctc 2509 

CDS 874.-2964 
mediate cross talk between cell surface and intracellular ion channels. 

>gi|l2804622|gb|BC001734.l|BC001734 Homo sapiens, protein translocation 
complex beta, clone MGC:1255 
Identities = 14/14 (100%) 

Query: 100 cggtgcctgccgag 113 

iniiiiiiiiiii 

Sbjct: 233 cggtgcctgccgag 220 

CDS 77.. 367 

>gi | 22053428 | ref |XM_J>38146.5 | Homo sapiens interferon, gamma -inducible protein 
30 (IFI30), mRNA 
Identities = 16/17 (94%) 



Query: 100 cggtgcctgccgagcct 116 

MM Ml III I Mill 

Sbjct: 289 cggtggctgccgagcct 305 

CDS 74.. 826 

/products "similar to Gamma- interferon inducible lysosomal thiol reductase 
precursor (Gamma- interferon- inducible protein IP-30) " 

>gi | 7657145 | ref |NM_014365.1 | Homo sapiens protein kinase Hll (Hll) , mRNA 
Identities = 13/13 (100%) 



Query: 101 ggtgcctgccgag . 113 

1 1 1 1 1 1 1 1 

Sbjct: 763 ggtgcctgccgag 775 

CDS 524.. 1114 

/note=" contains hsp20/crystallin family domain; estradiol -induced; small stress 
protein- like protein HSP22" " 

>gi | 21264316 | ref |NM_014599 . 3 | Homo sapiens melanoma antigen, family D, 2 
(MAGED2), mRNA 
Identities = 17/18 (94%) 

Query: 101 ggtgcctgccgagcctct 118 

MINI MINIM 

Sbjct: 332 ggtgcctcccgagcctct 315 

CDS 97.. 19 17 

/no te= "hepatocellular carcinoma associated protein; breast cancer associated 
gene 1" 

>gi 1 11967745 |emb|AJ293618.l|HSA293618 Homo sapiens mRNA for hypothetical 

protein 11B6, clone XP11B6 

Identities - 17/18 (94%) 

Query: 101 ggtgcctgccgagcctct 118 

iiiiiii Miiiiiiii 

Sbjct: 248 ggtgcctcccgagcctct 231 

CDS 13.. 183 3 

>gi | 20514781 | ref |NM_139015 . 1 | Homo sapiens SPPL3 (SPPL3), mRNA 
Identities = 14/14 (100%) 

Query: 104 gcctgccgagcctc 117 

MM I II 1 1 III II 

Sbjct: 569 gcctgccgagcctc 582 

CDS 1..1905 
/products "hypothetical protein XP_D68909" 

>gi|23094385|emb|AJ345030.l|HSA345030 Homo sapiens mRNA for presenilin-like 
protein 4 (PSL4 gene) 
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Identities = 14/14 (100%) 
Query: 104 gcctgccgagcctc 117 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 598 gcctgccgagcctc 611 

CDS 54.. 1208 

/functions "putative intramembrane protease" 

>gi|4502840|ref |NM_003654 . 1 | Homo sapiens carbohydrate (keratan sulfate Gal-6) 
sulfotransf erase 1 (CHST1) , mRNA 
Identities = 16/17 (94%) 

Query: 105 cctgccgagcctctacg 121 

Mill MIMIIMI 

Sbjct: 735 cctgcggagcctctacg 751 

CDS 367.. 1602 

/note=" carbohydrate (chondroitin 6/keratan) sulfotransf erase 1" 
/protein_id= «NP_J>03645 . 1" 

>gi | 17485022 | ref |XM_066361, 1 | Homo sapiens similar to glutathione S- 
transf erase theta 1 (LOC129041) , mRNA 
Identities = 13/13 (100%) 

Query: 105 cctgccgagcctc 117 

MMMMMMI 

Sbjct: 580 cctgccgagcctc 568 

CDS 1..633 
/product=" similar to glutathione S-transf erase theta 1" 

>gi|22134527|gb|AF33l523.l| Homo sapiens chromosome 12 putative anion 
transporter mRNA, partial 
Identities = 13/13 (100%) 

Query: 106 ctgccgagcctct 118 

MMMMMMI 

Sbjct: 807 ctgccgagcctct 819 

CDS <312..2003 
note= "member of the SLC26 family; 

>gi | 14784297 | ref | XM_031102 . 1 | .Homo sapiens Breakpoint cluster region protein, 
uterine leiomyoma, 2 (BCRP2) , mRNA 
Identities - 13/13 (100%) 

Query: 108 gccgagcctctac 120 

MMMMMMI 

Sbjct: 1784 gccgagcctctac 1796 

CDS 55.. 2883 

/products similar to KIAA1824 protein" 

>gi | 20535791 | ref | XM_11?632 . 1 | Homo sapiens LOC205318 (LOC205318) , mRNA 
Identities = 14/14 (100%) 

Query: 123 tcggctctagcacc 136 

MMMMMMM 

Sbjct: 491 tcggctctagcacc 504 
" CDS lJ.522 " ' 

/product= "hypothetical protein XP_119632" 

>gi | 4557448 | ref |NM_001271.1 | Homo sapiens chromodomain helicase DNA binding 
protein 2 (CHD2) , mRNA 
Identities = 14/14 (100%) 
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Query: 125 ggctctagcacctt 138 

IIIIIIIIIIIMI 

Sbjct: 2791 ggctctagcacctt 2778 
CDS 708.. 5927 



/products "chromodomain helicase DNA binding protein 2" 

>gi | 21264574 | ref |NM_139135. l| Homo sapiens SWI/SNF related, matrix associated, 
actin dependent regulator of chromatin, subfamily f , member 1 (SMARCF1) , 
transcript variant 2, mRNA 
Identities = 14/14 (100%) 

Query: 128 tctagcaccttgac 141 

IIIIIIIIIIIMI 

Sbjct: 5474 tctagcaccttgac 5487 

CDS 371.. 6577 

/note« n brain protein 120? chromosome 1 open reading frame 4; SWI/SNF complex 
protein p270; BRG1 -associated factor 250a; chromatin remodeling factor p250; 
OSA1 nuclear protein" 

>gi|l8129612|gb|AF333072.2|AF333072 Homo sapiens HERV-K18.1 5 1 long terminal 
repeat, complete sequence; gag protein (gag) gene, gag-K18.1 allele, complete 
cds; pol protein (pol) gene, pol-K18.1 allele, complete cds; env protein (env) 
gene, env-KlB.l allele, complete cds; and 3 1 long terminal repeat, complete 
sequence 

Identities = 17/18 (94%) 

Query: 143 tactctaactccacctct 160 

MINIUM Mill 

Sbjct: 1196 tactctaactccccctct 1179 

CDS 1113.. 1874 

>gi 1 4503778 | ref |NM_002029.1 | Homo sapiens formyl peptide receptor 1 (FPR1) , 
Identities « 14/14 (100%) 

Query: 148 taactccacctctg 161 

MIIIIIIMIIM 

Sbjct: 1102 taactccacctctg 1089 

CDS 62 . . 1114 

/product =" formyl peptide receptor 1" 
/product= "protein tyrosine kinase -7" 

>gi|21655145|gb|AY082886.l| Homo sapiens eukaryotic translation initiation 
factor 4GI (EIF4GI) 
Identities = 14/14 (100%) 

Query: 150 actccacctctggt 163 

IMIMIIIIIIM 

Sbjct: 1400 actccacctctggt 1387 
CDS 275.. 5077 

>gi | 13357213 | ref |NM_015545 . 1 | Homo sapiens KIAA0632 protein (KIAA0632) , mRNA 
Identities = 17/18 (94%) 

Query: 152 tccacctctggtagggcc 169 

1 1 1 1 1 1 1 1 1 1 1 1 Mill 

Sbjct: 931 tccacctctggttgggcc 914 

CDS 282.. 1790 

/products "KIAA0 63 2 protein" 

>gi|l8182862|gb|BC015632.l| Homo sapiens, similar to hypothetical protein 
XP_166541, clone 
Identities - 18/19 (94%) 
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Query: 153 ccacctctggtagggccac 171 

limn iiiiiiiiiii 

Sbjct: 2098 ccacctcgggtagggccac 2080 
CDS 52. .2517 

>gi 1 24432033 | ref |NM_004959 . 3 | Homo sapiens nuclear receptor subfamily 5, group 
A, member 1 (NR5A1) , 
Identities = 17/18 (94%) 

Query: 159 ctggtagggccacctctg 176 

Mil lllllllllllll 

Sbjct: 2316 ctgggagggccacctctg 2299 
CDS 52.. 13776 

>gi| 17432414 |gb|AF447167.l|F447157S05 Homo sapiens protein tyrosine kinase-7 
(PTK7) gene, exons 11, 12, and 13 
Identities « 15/15 (100%) 

Query: 161 ggtagggccacctct 175 

IIIIMI Mllllll 

Sbjct: 553 ggtagggccacctct 567 
CDS AF447164.1: 548. .683 

>gi | 19882212 | ref lNM_0321l9.il Homo sapiens very large G protein- coupled 
receptor 1 (VLGR1) , mRNA 
Identities a 17/18 (94%) 

Query: 170 acctctgatagctctggt 187 

MINIUM IIIIMI 

Sbjct: 11300 acctctgataactctggt 11283 
CDS 97.. 19020 

>gi | 22044294 | ref | XM_174449 . 1 | Homo sapiens LOC255281 (LOC255281) , mRNA 
Identities = 16/16 (100%) 

Query: 180 cctctgatagctctgg 196 

IMIIIIIIIIIIIII 

Sbjct: 460 cctctgatagctctgg 445 
CDS 1..474 

>gi|l841544|gb|U89337.l|HSMHC3W36A Homo sapiens HLA class III region 
containing NG7, cAMP response element binding protein- related protein (CREB-RP) , 
and tenascin X genes, 
Identities = 17/18 (94%) 

Query: 180 gctctggtgccaccaccc 197 

iiiiiiiiiii linn 

Sbjct: 54778 gctctggtgcctccaccc 54795 
CDS 54566.. 54883 



>gi | 61647 03 |gb|AF167572.l|AF167572 Homo sapiens protein methyltransferase 
(JBP1) mRNA, complete cds 
identities = 14/14 (100%) 

Query: 181 ctctggtgccacca 194 

Ml IIIIIIIIIII 

Sbjct; 574 ctctggtgccacca 561 

CDS 92.. 2005 

/function="methylates histones H2A and H4 and myelin basic 
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/product= "protein methyl transferase 11 

gi 1 2323409 |gb|AF015913.l|AF015913 Homo sapiens SKBlHs mRNA, complete cds 
Identities = 14/14 (100%) 



Query: 181 ctctggtgccacca 194 

MINIUM MM 

Sbjct: 483 ctctggtgccacca 470 

CDS 1 . . 1914 

/note= n homolog of fission yeast Skbl" 

>gi 1 18490998 | ref |NM_003882 .2 | Homo sapiens WNT1 inducible signaling pathway 
protein 1 (WISP1) , transcript variant 1, mRNA 
Identities = 18/19 (94%) 

Query: 181 ctctggtgccaccacccgc 199 

IMMIMII 1 1 1 1 1 1 1 1 

Sbjct: 569 ctctggtgcccccacccgc 587 
CDS 77.. 1180 

>gi 1 14245731 1 dbj |AB051853.l| Homo sapiens ARHGAP9 gene for rho-GTPase 
activating protein, complete 
Identities = 15/15 (100%) 

Query: 181 ctctggtgccaccac 195 

MINIMUM III 

Sbjct: 2013 ctctggtgccaccac 2027 

CDS 140.. 2335 

/function-" regulating adhesion of hematopoietic cells to 
extracellular matrix" 

>gi 1 16876446 | ref |NM__054028.1 1 Homo sapiens acyl-malonyl condensing enzyme 
(AMAC), mRNA 

Identities = 14/14 (100%) 
Query: 181 ctctggtgccacca 194 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 220 ctctggtgccacca 233 
CDS 122,. 113 8 

>gi 1 185943 99 1 ref | XM_092954 . 1 1 Homo sapiens similar to acidic protein rich in 
leucines (LOC164697) , mRNA 
Identities = 14/14 (100%) 

Query: 182 tctggtgccaccac 195 

I M 1 1 1 1 1 1 II 1 1 1 

Sbjct: 721 tctggtgccaccac 734 
CDS 1..2454 

/product="similar to acidic protein rich in leucines" 

>gi | 20553841 1 ref |XM_031689 . 6 1 Homo sapiens MAX dimerization protein 5 (MGA) , 
mRNA 

Identities « 14/14 (100%) 
Query:* 182 tctggtgccaccac 195 

1 1 1 i 1 1 1 1 1 1 1 1 1 1 

Sbjct: 463 tctggtgccaccac 476 

CDS 82.. 4773 

/product=" similar to MAX- interacting protein" 

>gi 1 18575418 | ref | XMJL00074 . 1 1 Homo sapiens L0C1594 80 (LOC159480) , mRNA 
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Identities « 14/14 (100%) 
Query: 183 ctggtgccaccacc 196 

iiiiiiiiiiiiii 

Sbjct: 475 ctggtgccaccacc 488 

CDS 1 , . 1425 

/product = "hypothetical protein XP_100074" 

>gi | 6912511] ref |NM_012330.l| Homo sapiens monocytic leukemia zinc finger 
protein- related factor (MORF) , mRNA 
Identities = 14/14 (100%) 

Query: 183 ctggtgccaccacc 196 

iiiiiiiiiiiiii 

Sbjct: 1535 ctggtgccaccacc 1548 

CDS 316.. 6537 

/note=" alternatively spliced; histone acetyl transferase" 
/product=" monocytic leukemia zinc finger protein- related factor" 

>gi|l80322ll|gb|AF217500.l|AF2l7500 Homo sapiens histone acetyl transferase 
MOZ2 (M0Z2) mRNA, complete cds 
Identities = 14/14 (100%) 

Query: 183 ctggtgccaccacc 196 

iiiiiiiiiiiiii 

Sbjct: 1708 ctggtgccaccacc 1721 

CDS 489.. 6707 

/note="MYST family member; similar to MOZ" 
/product= "histone acetyl transferase MOZ2" 

>gi | 24497588 | ref |NM_139058 . 1 | Homo sapiens aristaless related homeobox (ARX) , 
mRNA 

Identities = 15/15 (100%) 
Query: 185 ggtgccaccacccgc 199 

iiiiiiiiiiiini 

Sbjct: 663 ggtgccaccacccgc 649 
CDS 1..1689 

>gi | 4758787 | ref |NM_004551. 1 | Homo sapiens NADH dehydrogenase (ubiquinone) Fe-S 
protein 3 # 30kDa (nadh- coenzyme Q reductase) (NDUFS3) , mRNA 
Identities = 14/14 (100%) 

Query: 187 tgccaccacccgct 200 

iiiiiiiiiiiiii 

Sbjct: 675 tgccaccacccgct 662 
CDS ' 13.. 807 

>product="bA17lA24.1 (RAR-related orphan receptor B) " gene="R0RB"/ 
Identities a 27/29 (93%) 

Query: 189 ccaccacccgctcctcctcctgctgctgc 217 

iiiinii iiiiiiiiiiiiiiinii 

Sbjct: 140523 ccaccaccaactcctcctcctgctgctgc 140551 
CDS: 140352. .>140970 

>gi | 23510326 | ref |NM_015692 . 1 | Homo sapiens alpha-2 macroglobulin family 
protein VIP (VIP) , mRNA 
Identities = 21/22 (95%) 

Query: 195 cccgctcctcctcctgctgctg 216 



9 



WO 2004/056857 PCT/EP2003/014762 

-'• 29/77 



10/539535 



Mil II llllllllllll 

Sbjct: 47 cccgctcctgctcctgctgctg 68 

CDS 18.. 5675 

/note=" contains Kazal-type serine protease inhibitor domain" 

>gi 1 21536391 1 ref |NM_007037 .2 | Homo sapiens a disintegrin-like and 
metalloprotease (reprolysin type) with thrombospondin type 1 motif, 8 (A0AMTS8) , 
Identities = 29/32 (90%) 

Query: 196 ccgctcctcctcctgctgctgcttctgctgct 227 

MINI II lllllllllll llllllll 

Sbjct: 741 ccgctcctgctgctgctgctgctgctgctgct 772 
CDS 708.. 3380 

>gi | 7382453 | ref |NM_005199. 3 | Homo sapiens cholinergic receptor, nicotinic, 
gamma polypeptide (CHRNG) , mRNA 
Identities = 22/23 (95%) 

Query: 196 ccgctcctcctcctgctgctgct 218 

Mill III MINI MINIM 

Sbjct: 19 ccgctgctcctcctgctgctgct 41 
CDS 1..1563. 

>gi 1 17738306 | ref |NM_006650.2 | Homo sapiens complexin 2 (CPLX2) , mRNA 
Identities = 18/18 (100%) 

Query: 197 cgctcctcctcctgctgc 214 

I IIIIIIIIIIIIMM 

Sbjct: 488 cgctcctcctcctgctgc 471 
CDS 346.. 750 

>gi 1 21362089 | ref |NM_032667.2 | Homo sapiens Bernardinelli-Seip congenital 
lipodystrophy 2 (seipin) (BSCL2) , mRNA 
Identities = 24/26 (92%) 

Query: 198 gctcctcctcctgctgctgcttctgc 224 

Mini iiiinii Milium 

Sbjct: 1797 gctcctgctcctgcttctgcttctgc 1822 
CDS 507.. 1901 

>gi 1 21703365 | ref |NM_022766.3 | Homo sapiens ceramide kinase (CERK) , mRNA 
Identities = 21/22 (95%) 

Query: 198 gctcctcctcctgctgctgctt 219 

lllllllllll iiiiiiini 

Sbjct: 1216 gctcctcctccagctgctgctt 1195 
Identities = 14/14 (100%) 
Query: 204 cctcctgctgctgc 217 

1 1 1 1 1 1 J 1 1 1 1 1 1 1 

Sbjct: 1586 cctcctgctgctgc 1599 

CDS 124.. 173 7 

/note=" lipid kinase LK4" 

>gi | 10198655 | ref |NM_020547 .1 | Homo sapiens anti-Mullerian hormone receptor, 
type II (AMHR2), mRNA 
Identities = 20/20 (100%) 

Query: 199 ctcctcctcctgctgctgct 218 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii I 
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Sbjct: 544 ctcctcctcctgctgctgct 563 
CDS 79.. 1800 



>gi|7662013|ref |NM_014745 . 1 1 Homo sapiens KIAA0233 gene product (KIAA0233) , 
Identities = 30/32 (93%) 

Query: 199 ctcctcctcctgctgctgcttctgctgctcct 230 

IIMMIIIIMIIIIIIII Ml IMMM 

Sirjct: 803 ctcctcctcctgctgctgctgctgatgctcct 772 
CDS 3, .6110 

>gi|4504382|ref |NM_001528 . l| Homo sapiens^HGF activator (HGFAC) mRNA 
Identities = 27/28 (96%) 

Query: 199 ctcctcctcctgctgctgcttctgctgc 226 

I il I M M M MM 

Sbjct: 64 ctcctcctcctgctgctgctgctgctgc 91 
CDS 4.. 1971 

>gi | 23111046 | ref |NM_152227 . l| Homo sapiens sorting nexin 5 (SNX5) , transcript 
variant 1, mRNA 
Identities = 18/18 (100%) 

Query: 200 tcctcctcctgctgctgc 217 

I I r 1 1 1 1 1 1 1 1 j i j 1 1 1 1 

Sbjct: 221 tcctcctcctgctgctgc 204 
CDS 181.. 1395 

>gi | 22507392 | ref |NMJ>22574.2| Homo sapiens PERQ amino acid rich, with GYF 
domain 1 (PERQ1) , mRNA 
Identities = 28/31 (90%) 

Query: 200 tcctcctcctgctgctgcttctgctgctcct 230 

cK . ^ io i.iiiiiiiiiii ii miiiiiii inn 

Sbjct: 1856 tcctcctcctgccgccgcttctgctcctcct 1826 
CDS 236.. 2689 

>gi | 10834965 | ref |NMJ)0O404 . 1 | Homo sapiens galactosidase, beta 1 (GLB1) , 
transcript variant 179423, mRNA 
Identities = 26/28 (92%) 

Query: 200 tcctcctcctgctgctgcttctgctgct 227 

mi mi miiiiiii n in in ii 

Sbjct: 83 tcctccttctgctgctggttctgctgct 110 
sig_j)eptide 61. .129 
CDS 61.. 2094 

>gi|l814019|gb|U84408.l|HSU84408 Human IL-1 receptor related protein MyD88 
mRNA, complete cds 
Identities = 20/20 (100%) 

Query: 201 cctcctcctgctgctgcttc 220 

I I I i 1 1 1 1 1 ) 1 1 1 1 1 1 1 1 1 1 

Sbjct: 433 cctcctcctgctgctgcttc 414 
CDS 61.. 951 

>gi|l5929589|gb|BC015219.l|BC015219 Homo sapiens, HBV associated factor, clone 
Identities = 25/27 (92%) 

Query: 201 cctcctcctgctgctgcttctgctgct 227 
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Sbjct: 1211 cctcctgctgctgctgcttccgctgct 1185 
CDS 434 ,.1966 

>gi| 4885332 |ref |NM_005306 . 1 | Homo sapiens G protein- coupled receptor 43 
(GPR43) , mRNA 
Identities = 22/23 (95%) 

Query: 201 cctcctcctgctgctgcttctgc 223 

iiiiiiiiiiiiiiiin mi 

Sbjct: 165 cctcctcctgctgctgctgctgc 187 
CDS 1..993 

/note="7tm_l; Region: 7 transmembrane receptor (rhodopsin 
family) " 

>gi 1 19111149 | ref |NMJL33265.l| Homo sapiens angiomotin (AMOT) , mRNA 
Identities = 24/26 (92%) 

Query: 202 ctcctcctgctgctgcttctgctgct 227 

1 1 1 1 1 llllll MM MMMM 

Sbjct: 2448 ctccttctgctgctgctgctgctgct 2473 
CDS 797.. 2824 

>gi | 24308357 |ref |NM_033253 . 1 | Homo sapiens 5 ' -nucleotidase, cytosolic IB 
(NT5C1B) , mRNA 
Identities = 24/26 (92%) 

Query: 203 tcctcctgctgctgcttctgctgctc 228 

llllll MINIMI 1 1 1 1 1 1 1 1 1 

Sbjct: 678 tcctcccgctgctgctgctgctgctc 653 

CDS 482.. 1690 

/note="5 ! nucleotidase; autoimmune infertility- related protein; 5? -nucleotidase, 
cytosolic IB; cytosolic 5 ' -nucleotidase IB; 5# -nucleotidase, cytosolic IB" 

>gi | 11545760 | ref |NM_022055 . 1 | Homo sapiens potassium channel, subfamily K, 
member 12 (KCNK12) , 
Identities = 22/23 (95%) 

Query: 204 cctcctgctgctgcttctgctgc 226 

1 1 1 i i 1 1 1 1 1 1 1 1 1 1 IIIIMI 

Sbjct: 59 cctcctgctgctgctgctgctgc 81 

CDS 1..1293 
/note="tandem pore domain potassium channel THIK-2" 

>gi | 5729946 | ref |NM_006681 . 1 1 Homo sapiens neuromedin U (NMU) , mRNA 
Identities - 23/24 (95%) 

Query: 205 ctcctgctgctgcttctgctgctc 228 

MIMIIMIM MMMM 

Sbjct: 169 ctcctgctgctgctgctgctgctc 192 

CDS 106.. 630 

sig_peptide 106. .207 

>gi|4128016|emb|AJ011701.l|HSA011701 Homo sapiens TRHR gene promoter and exons 
1-2, partial 

Identities = 20/20 (100%) 

Query: 205 ctcctgctgctgcttctgct 224 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1732 ctcctgctgctgcttctgct 1751 
exon 1691.. 1946 
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>gi|l7985370|gb|AF284094.l|AF284094 Homo sapiens 13 binding protein (BRI3BP) 
mRNA, complete cds 
Identities = 22/23 (95%) 

Query: 205 ctcctgctgctgcttctgctgct 227 

II I II II III MM II I Mill 

Sbjct: 130 ctcctgctgctgctgctgctgct 152 
CDS 88.. 843 

>gi 1 15625294 |gb| AF286190 . 1 1 AF286190 Homo sapiens VPS10 domain protein mRNA, 
Identities = 22/23 (95%) 

Query: 205 ctcctgctgctgcttctgctgct 227 

1 1 1 1 1 1 1 1 1 1 1 ) 1 1 minim 

Sbjct: 5 ctcctgctgctgctgctgctgct 27 
CDS ~ <1..>1251 

>gi|2876l|emb|xl3629.l|HSAPOA4 Human intestinal mRNA for apolipoprotein A- IV 
Identities = 22/23 (95%) 

Query: 205 ctcctgctgctgcttctgctgct 228 

IIIIMIIIIIIII IIIIIMI 

Sbjct: 1203 ctcctgctgctgctcctgctgct 1181 
CDS 46.. 1236 

>gi | 17458351 | ref | XMJJ47011 . 2 | Homo sapiens protein O-fucosyl transferase 1 
(POFUTl) , mRNA 
Identities = 23/24 (95%) 

Query: 206 tcctgctgctgcttctgctgctcc 229 

IIMMIIMIIIIMM Mill 

Sbjct: 90 tcctgctgctgcttctgccgctcc 113 
CDS 50. .1216 

>gi| 15812213 | ref | NM_03343l.l | Homo sapiens phosphodiesterase 5A, cGMP-specif ic 
(PDE5A) , transcript variant 4, mRNA 
Identities = 20/20 (100%) 

Query: 208 ctgctgctgcttctgctgct 227 

l [ 1 1 1 1 1 1 1 1 1 [ l ] l II 1 1 1 

Sbjct: 227 ctgctgctgcttctgctgct 208 
CDS 156.. 2753 

>gi|3252778|dbj |D89094.1| Homo sapiens mRNA for S^S'-cyclic GMP 
phosphodiesterase, complete 
Identities = 20/20 (100%) 

Query: 208 ctgctgctgcttctgctgct 227 

lllllllll! Illlll MM 

Sbjct: 391 ctgctgctgcttctgctgct 372 
CDS 320.. 2947 

>gi 1 11496985 1 ref |NM_012072 . 2 | Homo sapiens complement component 1, q 
subcomponent, receptor 1 (C1QR1) , mRNA 
Identities » 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

1 1 Ml 1 1 II 1 1 Mill III III 

Sbjct: 170 ctgctgctgctgctgctgctcct 192 
CDS 149.. 2107 
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>gi 1 4809281) ref |NM_001718. 2 | Homo sapiens bone morphogenetic protein 6 (BMP6) , 
Identities = 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

i 1 1 1 1 1 1 1 ! ! I MIIMIIIM 

Sbjct: 533 ctgctgctgctgctgctgctcct 511 

CDS 180.. 1721 

/note="Vg- related sequence; transforming growth factor-beta" 

>gi 1 14777259 | ref | XM_027568 . 1 | Homo sapiens similar to interleukin 9 receptor 
(LOC146316) , mRNA 
Identities = 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

1 1 r 1 1 1 1 1 1 1 1 Minium 

Sbjct: 1294 ctgctgctgctgctgctgctcct 1272 
CDS 660. ,1547 

>gi|2626738|dbj |AB005060.l| Homo sapiens mRNA for NTAK, complete cds 
Identities = 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

iiiiiiiiin iiiiiiiiin 

Sbjct: 341 ctgctgctgctgctgctgctcct 319 
CDS 226.. 2778 

>gi 1 4507106 1 ref |NM_003086 . 1 1 Homo sapiens small nuclear RNA activating 
complex, polypeptide 4,90kDa (SNAPC4) , mRNA 
Identities = 21/22 (95%) 

Query: 208 ctgctgctgcttctgctgctcc 229 

MINIMI I IIIIIIIMI 

Sbjct: 1994 ctgctgctgctgctgctgctcc 1973 
Identities - 27/29 (93%), Gaps = 1/29 (3%) 
Query: 200 tcctcctc-ctgctgctgcttctgctgct 227 

1 1 1 1 1 1 II IIIIIIIMII IIIMIII 

Sbjct: 2009 tcctcctcgctgctgctgctgctgctgct 1981 
CDS 376.. 4785 

>gi 1 21237798 | ref |NM_139205 . 1 | Homo sapiens histone deacetylase 5 (HDAC5) , 
transcript variant 2, 
Identities = 21/22 (95%) 

Query: 208 ctgctgctgcttctgctgctcc 229 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mil 

Sbjct: 1888 ctgctgctgcttctgcttctcc 1867 
Identities = 15/15 (100%) 

Query: 205 ctcctgctgctgctt 219 

1 1 1 1 1 1 1 1 ii 1 1 n : 

Sbjct: 670 ctcctgctgctgctt 656 

CDS 305. . 3418 

/note="isoform 2 is encoded by transcript variant 2; antigen NY-CO-9 n 

>gi|2564750|gb|AF029308.l|HTCRBCHR9 Homo sapiens chromosome 9 duplication of 
the T cell receptor beta locus and trypsinogen gene families 
Identities - 19/19 (100%) 
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Query: 209 tgctgctgcttctgctgct 227 

ill II 1 1 1 1 II II 1 1 1 M I 

Sbjct: 11391 tgctgctgcttctgctgct 11409 
V_segmeixt join(11390. .11420 



>gi| 1296750 |emb|Z49234.l|HSTCRB2X2 H . sapiens gene for T-cell receptor TCRBV2.2 
Identities « 19/19 (100%) 

Query: 209 tgctgctgcttctgctgct 227 

llllilllliiiliinii 

Sbjct: 976 tgctgctgcttctgctgct 994 
CDS 975..>1141 

>gi 1 13027808 | ref |NM_022718 . 1 | Homo sapiens matrix metal loproteinase 25 
(MMP25), transcript variant 2, mRNA 
Identities = 18/18 (100%) 

Query: 210 gctgctgcttctgctgct 227 

IIIMII llllllllll 

Sbjct: 264 gctgctgcttctgctgct 281 
CDS 238.. 1926 

>gi | 12803104 | gb | BC002356 . 1 |BC002356 Homo sapiens, nucleobindin 1, clone 
Identities = 21/22 (95%) 

Query: 213 gctgcttctgctgctcct 230 

linn milium 

Sbjct: 68 gctgctgctgctgctcct 85 
Query: 208 ctgctgctgcttctgctgctcc 229 

1 1 1 1 1 f i ] 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1235 ctgctgctgcttccgctgctcc 1214 
CDS 27.. 1412 

>gi 1 24496766 | ref | NM_004712 . 3 | Homo sapiens hepatocyte growth factor- regulated 
tyrosine kinase substrate (HGS) , mRNA 
Identities - 15/15 (100%) 

Query: 215 tgcttctgctgctcc 229 

lllllllllllllll 

Sbjct: 1732 tgcttctgctgctcc 1718 
CDS 78.. 2411 

>gi | 20544115 | ref | XM_059933 . 5 | Homo sapiens similar to putative 
lysophosphatidic acid acyl transferase (L0C137964) , mRNA 
Identities = 15/15 (100%) 

Query: 216 gcttctgctgctcct 230 

lllllllllllllll 

Sbjct: 2233 gcttctgctgctcct 2219 
CDS 913.. 2283 

>gi|22770666|gb|AF531299.l| Homo sapiens histone HI (HIST1H1A) gene, complete 
Identities = 15/15 (100%) 

Query: 216 gcttctgctgctcct 230 

lllllllllllllll 

Sbjct: 551 gcttctgctgctcct 565 
CDS 521.. 1168 
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>gi| 18390058 |gb|AF463518.l| Homo sapiens cell recognition p 
(CASPR4) mRNA, complete 
Identities = 15/15 (100%) 

Query: 216 gcttctgctgctcct 230 

llillllllllllll 
Sbjct: 1568 gcttctgctgctcct 1582 

CDS 140.. 4075 

/product="cell recognition protein CASPR4" 

>gi | 21359973 | ref |NM_053276 . 2 | Homo sapiens vitrin (VTT) , mRNA 
Identities - 19/20 (95%) 

Query: 216 cttctgctgctcctaccacc 236 

Milium minim 

Sbjct: 835 cttctgctgcttctaccacc 854 
CDS 222.. 2303 

>gi | 23308602 | ref |NM_015460 . 1 | Homo sapiens myosin VIIA and Rab interacting 
protein (MYRIP) , mRNA 
Identities = 15/15 (100%) 

Query: 220 ctgctgctcctacca 234 

llillllllllllll 

Sbjct: 409 ctgctgctcctacca 423 

CDS 137.. 2716 

/product= "myosin VIIA and Rab interacting protein 0 

>gi| 15559110 |gb|AF414087.l| Homo sapiens small breast epithelial mucin mRNA, 
complete cds 

Identities = 16/16 (100%) 
Query: 220 ctgctgctcctaccac 235 

iiiiiiiiiiiinii 

Sbjct: 210 ctgctgctcctaccac 225 
CDS 47.. 319 

note="SBEM; secreted protein; similar to Mus musculus 

>gi|22779205|dbj |AB083783.l| Homo sapiens slac2-c mRNA for Sip homologue 
lacking C2 domains-c, complete cds 
Identities = 15/15 (100%) 

Query: 220 ctgctgctcctacca 234 

llillllllllllll 

Sbjct: 273 ctgctgctcctacca 287 
CDS 1..2580 

>gi| 7705267 | ref |NMJ) 16255 . 1 1 Homo sapiens family with sequence similarity 8 # 
member Al (FAM8A1) , 
Identities = 15/15 (100%) 

Query: 226 ctcctaccaccgccg 240 

llillllllllllll 

Sbjct: 147 ctcctaccaccgccg 161 
CDS ' * * 56.. 1297 

/product^ "Autosomal Highly Conserved Protein" 

>gi 1 14210509 1 ref |NM_032496 . 1 | Homo sapiens rho-gtpase activating protein 
ARHGAP9 (ARHGAP9) , mRNA 
Identities = 15/15 (100%) 
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Query: 240 gcctctggtgccacc 254 

iiiiiiiiiiiiiii 

Sbjct: 2335 gcctctggtgccacc 2349 

CDS 407.. 2659 

/p roduc t = " hypothet ical protein MGC12 959™ 

>gi|l84756|gb| J00221. 1 |HUMIGCD7 Human Ig germline H-chain G-E-A region B: 
alpha-2 A2m(l) allele constant region, 3 f end 
Identities m 15/15 (100%) 

Query: 240 gcctctggtgccacc 254 

iiiiiiiiiiiiiii 

Sbjct: 800 gcctctggtgccacc 814 

CDS join (<164. .469,684. .1004,1227. .1621) 

/product=" immunoglobulin alpha-2 heavy chain" 

>gi | 21361375 | ref | NM_007165 . 2 | Homo sapiens splicing factor 3a, subunit 2, 
66kDa (SF3A2), mRNA 
Identities = 16/16 (100%) 

Query: 248 tgccaccgcccccgcc 263 

Ml IMMIIIIIII 

Sbjct: 876 tgccaccgcccccgcc 891 

CDS 125.. 1519 

/note= M Spliceosome protein SAP- 62; splicing factor 3a, 
subunit 2, 66kD" 

>gi | 21361291 | ref | NM_005611.2 | Homo sapiens retinoblastoma- like 2 (p!30) 
(RBL2), mRNA 

Identities = 15/15 (100%) 
Query: 249 gccaccgcccccgcc 263 

iiiiiiiiiiiiiii 

Sbjct: 93 gccaccgcccccgcc 107 
CDS 70.. 3489 

>gi|4505322 | ref | KM_003941 . 1 | Homo sapiens Wiskott-Aldrich syndrome-like 
(WASL) , mRNA 

Identities = 15/15 (100%) 
Query: 249 gccaccgcccccgcc 263 

IIIIIIIIIIIIIII 

Sbjct: 1406 gccaccgcccccgcc 1420 
CDS 255.. 1772 

>gi 1 5901937 | ref |NM_007021. 1 1 Homo sapiens decidual protein induced by 
progesterone (DEPP) , mRNA 
Identities = 15/15 (100%) 

Query: 249 gccaccgcccccgcc 263 

iiiiiiiiiiiiiii 

Sbjct: 787 gccaccgcccccgcc 801 
CDS 219.. 857 ^ 

>gi | 22045278 | ref | XMJ)01334 . 5 | Homo sapiens POU domain, class 3, transcription 
factor 1 (POU3P1) , 
Identities = 16/16 (100%) 

Query: 250 ccaccgcccccgccgg 265 

IIIMIIIIIIIIIII 

Sbjct: 1326 ccaccgcccccgccgg 1341 
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CDS 36.. 1391 

/product= "similar to Oc tamer -binding transcription factor 6 (OCT- 6) (POU-domain 
transcription factor SCIP) (TST-1) « 

>gi | 24234749 | ref |NM_012218 .2 | Homo sapiens interleukin enhancer binding factor 
3, 90kDa (ILP3) , transcript variant 1, mRNA 
Identities = 15/15 (100%) 

Query: 250 ccaccgcccccgccg 264 

iiiiiiiiiniiii 

Sbjct: 2389 ccaccgcccccgccg 2375 

CDS 267.. 2951 

/note^'isoform a is encoded by transcript variant 1; double- stranded RNA-binding 
protein, 76 kD; M-phase phosphoprotein 4; nuclear factor associated with dsRNA; 
nuclear factor of activated T-cells, 90 kD; translational control protein 80" 

>gi|l90749|gb|M96684.l|HUMPURA H . sapiens Pur (pur-alpha) mRNA, complete cds 
Identities = 16/16 (100%) 

Query: 250 ccaccgcccccgccgg 265 

IMIIIIIIIIIIMI 

Sbjct: 163 ccaccgcccccgccgg 148 

CDS 60.. 1028 

/functions "sequence- specific single- stranded DNA binding protein" 

>gi | 4885128 | ref |NM_005194 . 1 | Homo sapiens CCAAT/ enhancer binding protein 
(C/EBP) , beta (CBBPB) , 
Identities = 15/15 (100%) 

Query: 250 ccaccgcccccgccg 264 

1 1 1 ! f 1 1 1 : 1 1 1 1 1 1 

Sbjct: 484 ccaccgcccccgccg 498 
CDS 1..1038 

>gi | 24850134 | ref |NM_170695 . 1 | Homo sapiens TGFB-induced factor (TALE family 
homeobox) (TGIF) , 
Identities = 18/19 (94%) 

Query: 253 ccgcccccgccggtgcccg 271 

IMIIIIIIIIII Mill 

Sbjct: 374 ccgcccccgccggagcccg 356 
CDS 304.. 1509 

>gi | 20805946 |gb| AY083269.1 | Homo sapiens transcription factor mammalian MafA 
gene, complete cds 
Identities = 18/19 (94%) 

Query: 253 ccgcccccgccggtgcccg 271 

him iniiiiiiiiii 

Sbjct: 236 ccgccgccgccggtgcccg 218 
CDS 1..1059 

>gi|5058992|gb|U66095.l|U66095 Homo sapiens cell-line THP-1 GTP cyclohydrolase 
I mRNA, complete 
Identities = 15/15 (100%) 

Query: 257 ccccgccggtgcccg 271 

iiiiiiiiiniiii 

Sbjct: 177 ccccgccggtgcccg 163 
CDS 145.. 846 
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>gi |4507750 |ref |NM_001071.1 | Homo sapiens thymidylate synthetase (TYMS) , mRNA 
Identities = 15/15 (100%) 

Query: 261 gccggtgcccgtgcg 275 

iiiiiiiiiiiini 

Sbjct: 267 gccggtgcccgtgcg 253 
CDS 106.. 1047 

>gi| 17511946 |gb|BC018929.l|BC018929 Homo sapiens, Similar to T-cell death 
associated gene, clone 
Identities = 15/15 (100%) 

Query: 261 gccggtgcccgtgcg 275 

IMIIIIIIIIIIII 

Sbjct: 1029 gccggtgcccgtgcg 1015 
CDS 279. .1058 

>gi 1 6679302) ref |NM_007350.l| Homo sapiens pleckstrin homology- like domain, 
family A, member l(PHLDAl), mRNA 
Identities = 15/15 (100%) 

Query: 261 gccggtgcccgtgcg 275 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1333 gccggtgcccgtgcg 1319 
CDS 160.. 1362 

>gi|23097243 | ref | NM_152891 . 1 | Homo sapiens serine protease EOS (EOS) , mRNA 
Identities = 19/20 (95%) 

Query: 263 cggtgcccgtgcgaccggtg 282 

IMIIIIIIIIIIII 1 1 1 1 

Sbjct: 385 cggtgcccgtgcgacgggtg 404 
CDS 69.. 923 

>gi 1 20555609 | ref | XMJ.65720 . 1 1 Homo sapiens HCR (a-helix coiled-coil rod 
homologue) (HCR) , mRNA 
Identities = 15/15 (100%) 

Query: 275 gaccggtggtggtag 289 

IMIIIIIIIIIIII 

Sbjct: 1573 gaccggtggtggtag 1559 
CDS 80.. 2428 

>gi 1 10947055 | ref |NMJ)20987 . 1 1 Homo sapiens ankyrin 3, node of Ranvier (ankyrin 
G) (ANK3), transcript variant 1, mRNA 
Identities = 21/21 (100%) 

Query: 280 gtggtggtagtggtggtggtg 300 

MM IIIIMIIIIIIIIIII 

Sbjct: 12113 gtggtggtagtggtggtggtg 12093 

Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

niiiiii iiiiiiiiiini 

Sbjct: 12096 ggtggtggcagtggtggtggtg 12075 

Identities = 18/18 (100%) 

Query: 279 ggtggtggtagtggtggt 296 
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Sbjct: 12123 ggtggtggtagtggtggt 12106 
Identities = 20/22 (90%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

llllll II IIIIIIIMIII 

Sbjct: 12111 ggtggtagtggtggtggtggtg 12090 
Identities = 19/21 (90%) 

Query: 279 ggtggtggtagtggtggt ggt 299 

MINIMI II IIIIIMI 

Sbjct: 12126 ggtggtggtggtagtggtggt 12106 
Identities = 13/13 (100%) 

Query: 279 ggtggtggtagtg 291 

IMIIIIIMIM 

Sbjct: 12081 ggtggtggtagtg 12069 
CDS 193.. 13326 

>gi | 7662227 | ref |NM_014841.l| Homo sapiens synaptosomal -associated protein, 
91kDa homolog (mouse) (SNAP91) , mRNA 
Identities = 20/20 (100%) 

Query: 279 ggtggtggtagtggtggtgg 298 

1 1 1 1 r ( 1 1 1 1 1 1 1 j 1 1 1 1 1 1 

Sbjct: 1890 ggtggtggtagtggtggtgg 1871 
CDS 244.. 2967 

Identities - 14/14 (100%) 

Query: 279 ggtggtggtagtgg 292 

IMIIIIIIIIIII 
Sbjct: 717 ggtggtggtagtgg 704 

Identities = 19/21 (90%) 

Query: 279 ggtggtggtagtggtggt ggt 299 

llllll II IMIMIMM 

Sbjct: 729 ggtggtagtggtggtggtggt 709 
CDS 320.. 1168 

>gij 5453935 | ref |NM_006236. 1 | Homo sapiens POU domain, class 3, transcription 
factor 3 (POU3F3), 
Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

1 1 I'll Mil I MM 1 1 Mill 

Sbjct: 829 ggtggtggtggtggtggtggtg 808 
CDS 1..1503 

>gi | 21396478 | ref |NM_005924 .2 | Homo sapiens mesenchyme homeo box 2 (growth 
arrest-specific homeo box) (MEOX2 ) , mRNA 
Identities = 21/22 (95%) 
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Query: 279 ggtggtggtagtggtggtggtg 300 

mum iii 1 1 Mini ii ii 

Sbjct: 404 ggtggtggtggtggtggtggtg 383 

Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

III II I III I II I MM I Ml 

Sbjct: 407 ggtggtggtggtggtggtggtg 386 

Identities = 20/22 (90%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

lllllll I IMMMIIMI 

Sbjct: 416 ggtggtgatggtggtggtggtg 395 
CDS 182.. 1093 

>gi | 21361336 | ref |NM_001969.2 | Homo sapiens eukaryotic translation initiation 
factor 5 (EIF5) , raRNA 

Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

II Ml MM III III Mill I 

Sbjct: 1022 ggtggtggtggtggtggtggtg 1001 
Identities = 19/20 (95%) 



Query: 281 tggtggtagtggtggtggtg 300 



Sbjct: 1023 tggtggtggtggtggtggtg 1004 
CDS 4 69.. 1764 

>gi | 12597624 | ref |NM_012068 . 2 | Homo sapiens activating transcription factor 5 
(ATP5) , mRNA 

Identities = 20/20 (100%) 

Query: 281 tggtggtagtggtggtggtg 300 

IIIIIIIMIMIIIIIIM 
Sbjct: 730 tggtggtagtggtggtggtg 711 

>gi | 20127494 | ref |NM_006237 .2 | Homo sapiens POU domain, class 4, transcription 
factor 1 (POU4P1) , 
Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

1 1 1 1 1 1 1 1 1 IMMMIIMI 

Sbjct: 553 ggtggtggtggtggtggtggtg 532 

Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

MINIMI IMMMIMM 

Sbjct: 556 ggtggtggtggtggtggtggtg 535 
Identities = 19/20 (95%) 
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Query: 281 tggtggtagtggtggtggtg 300 

lllllll IIIIIIIIMII 

Sbjct: 560 tggtggtggtggtggtggtg 541 

CDS 235.. 1497 

>gi|20379115|gb|AF498971.l| Homo sapiens small GTP binding protein RhoB (ARHB) 
mRNA, complete 
Identities = 15/15 (100%) 

Query: 299 tggtggtggtgggcg 313 

M MINIMUM 

Sbjct: 23 tggtggtggtgggcg 37 
CDS 1..591 

>gi| 190939|gb|M38453.l|HUMRASTG Human ras transforming protein gene, exon 1 
Identities = 15/15 (100%) 

Query: 2 99 tggtggtggtgggcg 313 

II MIIIIIMI 

Sbjct: 149 tggtggtggtgggcg 163 
exon 133 . .243 

>gi | 20544140 | ref | NM_003185 . 2 | Homo sapiens TAF4 RNA polymerase II, TATA box 
binding protein (TBP) -associated factor, 135kDa (TAF4), mRNA 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

IIIIIMIilllll 

Sbjct: 125 tggtggtggtgggc 112 
CDS 1..3252 

>gi | 21361862 | ref |NM_033104 .2 | Homo sapiens stonin 2 (STN2) , mRNA 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

llllllllllllll 

Sbjct: 2110 tggtggtggtgggc 2097 

CDS 202. .2919 

>gi)22597105|gb|AF521671.l| Homo sapiens SWI/SNF chromatin remodeling complex 
subunit OSA2 

Identities = 14/14 (100%) 
Query: 299 tggtggtggtgggc 312 

llllllllllllll 

Sbjct: 68 tggtggtggtgggc 55 
CDS <1..6498 

>gi 1 22051956 | ref | XM_JL13625.2 | Homo sapiens similar to Antrax toxin receptor 
precursor (Tumor endothelial marker 8) (LOC195977) , mRNA 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

llllllllllllll 

Sbjct: 411 tggtggtggtgggc 398 
CDS 251.. 1171 

>gi | 17863992 | gb ] AF449430 . 1 | AF449430 Homo sapiens endocytosis protein HSTNB 
variant mRNA, complete cds 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 
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iiiiiiiiiiiiM 

Sbjct: 2110 tggtggtggtgggc 2097 

CDS 202 ..2919 

>gi | 11065969 |gb | AP193855 . 1 | AP193855 
cerebellum ZIC2 (ZIC2) mRNA, 
Identities = 14/14 (100%) 



Homo sapiens zinc finger protein of 



Query: 299 tggtggtggtgggc 312 

IIIIIIIIIIIIM 

Sbjct: 701 tggtggtggtgggc 688 
CDS 1..1599 



>gi 1 17474021 1 ref | XM_058523 . 1 1 
(LOC121015) , mRNA 
Identities = 14/14 (100%) 



Homo sapiens similar to MDM2 variant FB29 



Query: 302 tggtggtgggcggg 315 

Illlllllllllll 
Sbjct: 117 tggtggtgggcggg 104 
CDS 26.. 418 

>gi|21361620 |ref |NM_002633.2 | 
Identities = 14/14 (100%) 



Homo sapiens phosphoglucomutase 1 (PGM1) , mRNA 



Query: 302 tggtggtgggcggg 315 

Illlllllllllll 
Sbjct: 383 tggtggtgggcggg 396 

CDS 214.. 1902 



>gi| 6979929 |gb)AF221759.l|AF221759 
Identities = 14/14 (100%) 



Homo sapiens Maml mRNA, partial cds 



Query: 303 ggtggtgggcgggt 316 

illlllllllllll 

Sbjct: 1643 ggtggtgggcgggt 1630 
CDS <1..2682 



>gi | 4505736 | ref |NM_002621 . 1 | 
(PFC), mRNA 

Identities = 14/14 (100%) 



Homo sapiens properdin P factor, complement 



Query: 306 ggtgggcgggtact 320 

illlllllllllll 

Sbjct: 1493 ggtgggcgggtact 1480 
CDS 243.. 1652 



>gi | 20127484 | ref | NM_005654 . 2 | 
F, member 1 (NR2F1) , mRNA 
Identities = 14/14 (100%) 



Homo sapiens nuclear receptor subfamily 2, group 



Query: 319 tagcgcgacgtggg 332 

illlllllllllll 

Sbjct: 705 tagcgcgacgtggg 692 

CDS 98. .1369 

/note=" Transcription factor COUP l (chicken ovalbumin upstream promoter 1, ; 
transcription factor COUP 1 " 



>gi 1 16418382 | ref |NM_052876 . 1 1 
(NAC1) , mRNA 

Identities = 15/15 (100%) 



Homo sapiens transcriptional repressor NAC1 
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Query: 326 acgtgggcgaccagt 340 

illllllllllllll 

Sbjct: 404 acgtgggcgaccagt 418 

CDS 127.. 1710 

/note= n contains P02 domain n 

>gi 1 16445431 1 ref |NM_033662 . 1 | Homo sapiens WD repeat domain 4 (WDR4) , 
transcript variant 3, raRNA 
Identities = 16/16 (100%) 

Query: 328 gtgggcgaccagtggc 343 

llililiilliilill 

Sbjct: 882 gtgggcgaccagtggc 897 

CDS 363.. 1163 

/note="isoform 2 is encoded by transcript variant 3; WD repeat -containing 
protein 4" 

>gi 1 22027497 | ref |NMJ)12295.2 | Homo sapiens calcineurin binding protein 1 
(CABIN1) , mRNA 
Identities = 15/15 (100%) 

Query: 334 gaccagtggctgctg 348 

illllllllllllll 

Sbjct: 1787 gaccagtggctgctg 1801 
CDS 128.. 6790 

>gi 1 20336259 | ref |NM_015866.2 | Homo sapiens PR domain containing 2, with ZNP 
domain (PRDM2), transcript variant 2, mRNA 
Identities = 14/14 (100%) 

Query: 336 ccagtggctgctgg 349 

iiiiiiiniiiii 

Sbjct: 3329 ccagtggctgctgg 3316 

CDS 857.. 5905 

/note= "isoform b is encoded by transcript variant 2; zinc-finger DNA-binding 
protein; retinoblastoma protein- interacting zinc finger protein; MTE-binding 
protein" 

>gi | 22042322 | ref |XM_015428.3 | Homo sapiens similar to CGI-105 protein 
(LOC151313) , mRNA 
Identities = 14/14 (100%) 

Query: 337 cagtggctgctggg 350 

iiiniiiiiiiii 

Sbjct: 620 cagtggctgctggg 633 
CDS 11.. 955 

>gi (20270612 | ref |NG_001318.1 1 Homo sapiens HSP40 pseudogene (HSP40) 
Identities = 14/14 (100%) 

Query: 337 cagtggctgctggg 350 

iiiiiiiiiiiiii 

Sbjct: 2499 cagtggctgctggg 2486 
misc_f eature 1 . 1-2882 

>gi 1 21265045 | ref |NM_139027 . 1 | Homo sapiens a disintegrin-like and 
metalloprotease (reprolysin type) with thrombospondin type 1 motif, 13 
(ADAMTS13) , transcript variant 2, mRNA 
Identities m 17/17 (100%) 
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Query: 339 gtggctgctgggctggg 355 

MIIIMIMIIIIIII 

Sbjct: 3812 gtggctgctgggctggg 3828 

CDS 445.. 4560 

(vWF) -cleaving protease, which is responsible for cleaving at the 

>gi (22050832 | ref |XM_114863 . 2 | Homo sapiens similar to alpha 2 type IV collagen 
preproprotein;canstatin (LOC2 03630 ) , mRNA 
Identities = 16/16 (100%) 

Query: 339 gtggctgctgggctgg 354 

I I I I I I I I II I 1 1 I I I 
Sbjct: 450 gtggctgctgggctgg 465 

CDS 1..1425 
/products "similar to alpha 2 type IV collagen preproprotein; canstatin" 

>gi 1 22064435 1 ref | XM_017037 . 3 | Homo sapiens suppressor of Ty 6 homolog (S. 
cerevisiae) (SUPT6H) , 
Identities = 15/15 (100%) 

Query: 340 tggctgctgggctgg 354 

illllllllllllll 

Sbjct: 4624 tggctgctgggctgg 4610 
CDS 161.. 4972 

>gi|201497S6|gb|AF039196.3| Homo sapiens putative single zinc finger 
transcription factor protein (hairless) mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 341 ggctgctgggctggg 355 

Illllllllllllll 
Sbjct: 4218 ggctgctgggctggg 4204 

CDS 1485.. 5054 

/note= "restricted expression in the brain and skin" 

>gi | 20070162 | ref |NM_018896 . 2 | Homo sapiens calcium channel, voltage -dependent, 
alpha 1G subunit (CACNA1G) , mRNA 
Identities = 15/15 (100%) 

Query: 342 gctgctgggctgggt 356 

IIIMIMIIIMM 
Sbjct: 1440 gctgctgggctgggt 1426 
CDS 1..7134 

>gi 1 18564486 1 ref |XM_094865 . 1 1 Homo sapiens similar to Olfactory receptor 4P3 
(LOC168119) , mRNA 
Identities = 15/15 (100%) 

Query: 343 ctgctgggctgggtt 357 

MMIMIIIIIMI 

Sbjct: 49 ctgctgggctgggtt 35 
CDS 1..978 

>gi 1 4503532 | ref |NM_001417 . 1 1 Homo sapiens eukaryotic translation initiation 
factor 4B" (EIF4B) ; 
Identities = 16/16 (100%) 

Query: 350 gctgggttcacgtggt 365 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 393 gctgggttcacgtggt 378 
CDS 1..1836 
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>gi|4557252 |ref |NMJ)01109 . 1 1 Homo sapiens a disintegrin and metalloproteinase 
domain 8 (ADAM8) , 
Identities .= 15/15 (100%) 

Query: 360 cgtggtggtggttct 374 

III II II MM MM 

Sbjct: 1980 cgtggtggtggttct 1994 
CDS 10.. 2484 

>gi 1 20143921 1 ref |NM_133437 . 1 | Homo sapiens titin (TTN) , transcript variant 
no vex- 2, mRNA 
Identities = 17/18 (94%) 

Query: 360 cgtggtggtggttctcca 377 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 33611 cgtgatggtggttctcca 33628 

CDS 224.. 81580 

/note= 11 isoform novex-2 is encoded by transcript variant hovex-2; connectin; 
CMH9, included" 

>gi| 22726242 |gb |BC037404 . 1 | Homo sapiens, Similar to formin binding protein 4, 
Clone MGC: 36749 
Identities = 14/14 (100%) 

Query: 361 gtggtggtggttct 374 

I I I 1 I I I f I 1 1 I 1 1 
Sbjct: 2743 gtggtggtggttct 2730 

CDS 28.. 3075 

>gi 1 4557234 | ref |NM_000018 . 1 1 Homo sapiens acyl-Coenzyme A dehydrogenase, very 
long chain (ACADVL) , nuclear gene encoding mitochondrial protein, mRNA 
Identities = 14/14 (100%) 

Query: 362 tggtggtggttctc 375 

M I M 1 1 1 1 1 1 1 1 1 

Sbjct: 1818 tggtggtggttctc 1831 
CDS 86.. 2053 

>gi ] 22048275 | ref | XM_063346 . 3 | Homo sapiens similar to polypyrimidine- tract 
binding protein (L0C122 888) , mRNA 
Identities = 14/14 (100%) 

Query: 363 ggtggtggttctcc 376 

iimiimim 

Sbjct: 1345 ggtggtggttctcc 1332 
CDS 1..1461 

>gi 1 4885524 | ref | NM_005490 . 1 1 Homo sapiens SH2 domain containing 3A (SH2D3A) , 
Identities = 15/15 (100%) 

Query: 390 ctgcgcgctcctcca 414 

llliilllilliill 

Sbjct: 1319 ctgcgcgctcctcca 1305 
CDS- 15*2. .1882 

>gi | 22060841 | ref |XM_165659.2 | Homo sapiens elaC homolog 1 (E. coli) (ELAC1) , 
mRNA 

Identities = 16/16 (100%) 
Query: 397 ctcctccatcacccac 412 
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Sbjct: 894 ctcctccatcacccac 879 

CDS 108 ,.1199 

/product*" similar to elaC homolog 1 (E . coli) ; similar to Escherichia coli elaC; 
hypothetical protein D29; elaC 



>gi | 9055315 |ref |NM_012406.2 | Homo sapiens PR domain containing 4 (PRDM4) , mRNA 
Identities = 15/15 (100%) 

Query: 397 ctcctccatcaccca 411 

illllllllllllil 

Sbjct: 1109 ctcctccatcaccca 1123 
CDS 123.. 2528 

>gi 1 22046620 1 ref | XM_069728 . 3 | Homo sapiens similar to beta -glucuronidase 
(LOC136132) , mRNA 
Identities - 15/15 (100%) 

Query: 399 tcctccatcacccac 413 

illllllllllllil 

Sbjct: 663 tcctccatcacccac 649 
CDS 1..972 

>gi|l9263734|gb|BC025358.l| Homo sapiens, ATP-binding cassette, sub-family D 
(ALD) , member 1, 
Identities = 15/15 (100%) 

Query: 400 ctccatcacccaccg 414 

iiiiiiiiiiiiiii 

Sbjct: 2364 ctccatcacccaccg 2378 
CDS 400.. 2637 

>gi| 11968022 | ref |NM_022473.1 | Homo sapiens zinc finger protein 106 (ZFP106) , 
mRNA 

Identities = 15/15 (100%) 
Query: 400 ctccatcacccaccg 414 

iiiiiiiiiiiiiii 

Sbjct: 3838 ctccatcacccaccg 3852 

CDS 336.. 5987 

>gi | 18586624 | ref | XM_085530 . 1 | Homo sapiens similar to Adrenoleukodys trophy 
protein (ALDP) 
Identities = 15/15 (100%) 

Query: 400 ctccatcacccaccg 414 

IIIIIIIIIIIIIII 

Sbjct: 310 ctccatcacccaccg 324 
CDS 134.. 583 

misc__feature 161.. 376 

>gi| 19743876 |ref |NM_002918.2 | Homo sapiens regulatory factor X, 1 (influences 
HLA class II expression) (RFX1) mRNA 
Identities = 15/15 (100%) 

Query: 406 cacccaccgctgctg 420 

iiiiiiiiiiiiiii 

Sbjct: 220 cacccaccgctgctg 234 
CDS 93.. 3032 
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>gi| 19263734 |gb|BC025358.l| Homo sapiens, ATP -binding cassette, sub -family D 
(ALD) , member 1, 
Identities = 15/15 (100%) 
Query: 410 ctccatcacccaccg 424 

lllllllllllllll 

Sbjct: 2364 ctccatcacccaccg 2378 
CDS 400.. 2637 

>gi| 18586624] ref | XM_085530 . 1 1 Homo sapiens similar to Adrenoleukodys trophy 
protein (ALDP) (LOC146640) , mRNA 
Identities = 15/15 (100%) 

Query: 410 ctccatcacccaccg 424 

lllllllllllllll 

Sbjct: 310 ctccatcacccaccg 324 
CDS 134.. 583 

>gi | 11968022 | ref |NM_022473 .l| Homo sapiens zinc finger protein 106 (ZFP106) , 
mRNA 

Identities = 15/15 (100%) 
Query: 410 ctccatcacccaccg 424 

lllllllllllllll 

Sbjct: 3838 ctccatcacccaccg 3852 
CDS 336.. 5987 

>gi | 13184045 | ref |NM_023944 ,l| Homo sapiens cytochrome P450, subfamily IVF, 
polypeptide 12 (CYP4F12) , mRNA 
Identities = 17/17 (100%) 

Query: 4 13 cgctgctgagcctgccc 429 

iiiiiiiiiiiiinii 

Sbjct: 35 cgctgctgagcctgccc 51 
CDS 31.. 1605 

>gi | 23821028 | ref | NMJL53486 . 1 | Homo sapiens lactate dehydrogenase D (LDHD) , 
mRNA 

Identities = 20/22 (90%) 

Query: 424 ctgcccgacgcgcggctcctgc 445 

MINIMI llllll 1 1 1 1 

Sbjct: 637 ctgcccgacgggcggctgctgc 658 
CDS 5 8.. 1518 

>gi| 24528580 |gb|AF079529. 2 | Homo sapiens cAMP-specif ic phosphodiesterase 8B1 
(PDE8B) mRNA, complete cds; alternatively spliced 
Identities = 15/15 (100%) 

Query: 427 cccgacgcgcggctc 441 

lllllllllllllll 

Sbjct: 224 cccgacgcgcggctc 210 
CDS 46.. 2703 

>gi | 22001416 | ref | NM_0 15465 . 1 | Homo sapiens gemin 5 (GEMIN5) , mRNA 
SMN complex component; Sm- interacting protein; DKFZP586M1824 protein 
Identities = 14/14 (100%) 

Query: 434 cgcggctcctgccc 447 

I MINI lllllll 
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Sbjct: 17 cgcggctcctgccc 4 
CDS 1..4527 



>gi|29459|emb|X68149.l|HSBLRlA Homo sapiens BLR1 gene for Burkitt's lymphoma 
receptor 1 

Identities = 18/19 (94%) 

Query: 434 cgcggctcctgcccaagct 452 

1 1 1 1 1 1 1 1 1 1 1 iiiiiii 

Sbjct: 1085 cgcggctcctgaccaagct 1103 
CDS 85.. 1203 

>gi| 840783 |emb|X6882 9. l|HSMDCR H. sapiens mRNA for MDR15 protein 
Identities = 18/19 (94%) 

Query: 434 cgcggctcctgcccaagct 452 



>gi| 5032094 |ref |NM_005630 . 1 1 Homo sapiens solute carrier family 21 
(prostaglandin transporter) , member 2 (SLC21A2), mRNA 
Identities = 17/17 (100%) 

Query: 437 ggctcctgcccaagctc 453 

III Mill Mill MM 

Sbjct: 88 ggctcctgcccaagctc 104 

CDS 84.. 2015 

>gi|4505876 | ref | NM_0 00445 . 1 | Homo sapiens plectin 1, intermediate filament 
binding protein 500kDa (PLEC1) , mRNA 
Identities = 17/18 (94%) 

Query: 438 gctcctgcccaagctcct 455 



/functions "high molecular weight cytoskeletal -associated protein which is a 
component of hemidesmosomes in basal keratinocytes and also a component of the 
sarcolemma in muscle (HD1) 

>gi 1 22058106 1 ref |XM_171754 . 1 1 Homo sapiens similar to a disintegrin-like and 
metalloprotease (reprolysin type) with thrombospondin type 1 motif, 17 
preproprotein (LOC257018) , mRNA 
Identities = 15/15 (100%) 

Query: 438 gctcctgcccaagct 452 



>gi | 4505936 | ref [NM_002693. l| Homo sapiens polymerase (DNA directed), gamma 
(POLG) , nuclear gene encoding mitochondrial protein, mRNA 
Identities - 14/14 (100%) 

Query: 438 gctcctgcccaagc 451 

1 1 M II M M 1 1 M 

Sbjct: 1953 gctcctgcccaagc 1966 
CDS 283.. 4002 




Sbjct: 1154 cgcggctcctgaccaagct 
CDS 289.. 1272 



1172 
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>gi| 533527 |gb|U10694.l|HSU10694 Human MAGE -9 antigen (MAGE9) gene, complete 
cds 

Identities » 18/19 (94%) 

Query: 438 gctcctgcccaagctcctg 456 

m r 1 1 1 1 1 ii i iiiiin 

Sbjct: 1290 gctcctgcccacgctcctg 1308 
exon 1268. . >2845 

CDS 1333.. 2280 

>gi|475836l|ref |NM_004112.l| Homo sapiens fibroblast growth factor 11 (FGP11) f 
mRNA 

Identities = 16/16 (100%) 
Query: 442 ctgcccaagctcctgg 457 

Milium mini 

Sbjct: 589 ctgcccaagctcctgg 604 
CDS 1..678 

>gi 1 13435128 | ref | NM_022089 . 1 1 Homo sapiens putative ATPase (HSA9947) , mRNA 
Identities = 17/18 (94%) 

Query: 442 ctgcccaagctcctggtc 459 

111 Mil I Mllll 

Sbjct: 2555 ctgcccaaggtcctggtc 2572 
CDS 35.. 3577 

>gi 1 24308028 | ref | NM — 015296.1 1 Homo sapiens ziziminl (ziziminl) , mRNA 
Identities = 14/14 (100%) 

Query: 445 cccaagctcctggt 458 

iiiiiiiiniiii 

Sbjct: 2431 cccaagctcctggt 2418 

CDS 56.. 6265 

note="Cdc42 activator" 

>gi 1 22043940 | ref |XM_060678.5 | Homo sapiens similar to Synaptotagmin II (Sytll) 
(LOC127833) , mRNA 
Identities = 14/14 (100%) 

Query: 445 cccaagctcctggt 458 

IIIIIIIINIIII 

Sbjct: 540 cccaagctcctggt 527 
CDS 1..1278 

>gi | 18599586 jreflXM_092362.il Homo sapiens similar to 
evidence :NAS -hypothetical protein-putative (LOC165086) , mRNA 
Identities = 17/18 (94%) 

Query: 448 aagctcctggtctaggag 465 

in i in linn mi 

Sbjct: 776 aagctcctggtctgggag 759 
CDS 1. .936 

>gi | 23336903 | tpg|BK000566.l| TPA: Homo sapiens SF3bl25 DEAD -box protein mRNA, 

complete cds, 

Identities = 14/14 (100%) 

Query: 452 tcctggtctaggag 465 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

sbjct: 399 tcctggtctaggag 386 
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CDS 1..2460 

>gi 1 22052707 [ref (XMJL72523 . l| Homo sapiens similar to N-formyl peptide 
receptor (L0C256135) , mRNA 
Identities = 14/14 (100%) 

Query: 460 taggagtaaggcca 473 

IMIIIIIIIIIII 

Sbjct: 410 taggagtaaggcca 397 
CDS 81.. 560 

>gi|474428|emb|Z31702.l|HSP53DN H. sapiens p5-3 DNA 
Identities = 16/16 (100%) 

Query: 461 aggagtaaggccatgg 476 

iiiiiiiiiiiinii 

Sbjct: 264 aggagtaaggccatgg 279 
1. .1464 

Non-homologous recombination within the major histocompatibility 
complex creates a transcribed hybrid sequence 

>gi | 18550199 | ref |XM_059368 .2 | Homo sapiens similar to thymidilate kinase 
family LPS-inducible member; thymidylate kinase homologue (LOC129607) , mRNA 
Identities » 14/14 (100%) 

Query: 4 67 aaggccatgggcgc 480 

II I I I I I I I I I I I I 
Sbjct: 23 aaggccatgggcgc 10 
CDS 16.. 13 65 

>gi|6706902|emb|AL109827.8|HSJ309K20 Human DNA sequence from clone RP1-309K20 
on chromosome 20 Contains the gene for a novel protein similar to dysferlin, the 
SPAG4 gene for sperm associated antigen 4, the CPNE1 gene for Copine I (similar 
to KIAA0636), the gene KIAA0765 (HRIHFB2091) for an RNA recognition motif 
(RNP, RRM or RBD domain) containing protein and the 3' end of the NIFS 
gene for cysteine desulfurase, ' 
Identities = 16/16 (100%) 

Query: 468 aggccatgggcgcggc 483 

iiiiiiiiiiiinii 

Sbjct: 7506 aggccatgggcgcggc 7491 
CDS 7357.. 7540 

>gi 1 21614532 | ref |NM_144957 . 1 | Homo sapiens protease, serine, 21 (testisin) 
(PRSS21) t transcript variant 3, mRNA 
Identities = 14/14 (100%) 

Query: 468 aggccatgggcgcg 481 

IMIIIIIIIIIII 

Sbjct: 102 aggccatgggcgcg 115 
CDS 107.. 1009 

>gi| 18087852 | ref |NM_080672.1 | Homo sapiens Q9H4T4 like (H17739) , mRNA 
Identities = 18/19 (94%) 

Query: 469 ggccatgggcgcggccggc 487 

1 1 1 1 1 1 1 ! 1 1 MIMM 

Sbjct: 141 ggccatgggcccggccggc 123 
CDS 136.. 1815 
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>gi| 790818 |gb|L39891.l|HUMPKDlGEN Homo sapiens polycystic kidney disease- 
associated protein (PKD1) gene, 
Identities = 16/16 (100%) 



Query: 475 gggcgcggccggccgc 490 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 50097 gggcgcggccggccgc 50082 
CDS 49997.. 50171 



>gi | 24429581 | ref |NM_153813.1 | Homo sapiens friend of GATA-1 (F0G1) , raRNA 
Identities = 14/14 (100%) 



Query: 475 gggcgcggccggcc 487 

MINI MINIM 

Sbjct: 2503 gggcgcggccggcc 2490 
CDS 323.. 3337 



>gi | 22094134 | ref |NM_032482 . 1 1 Homo sapiens histone methyltransferase DOT1L 

(DOT1L) , mRNA 

Identities o 14/14 (100%) 



Query: 476 ggcgcggccggccg 489 

1 1 j 1 1 1 1 1 1 1 r 1 1 1 

Sbjct: 2314 ggcgcggccggccg 2301 

CDS 37.. 4650 

function= M me thylates lysine 79 of histone H3" 

>gi | 4759111 | ref |NMJ)04207 . 1 1 Homo sapiens solute carrier family 16 
(monocarboxylic acid transporters), member 3 (SLC16A3) , mRNA 
Identities = 14/14 (100%) 



Query: 477 gcgcggccggccgc 490 

1 1 ) J 1 1 9 1 1 1 1 ) 1 1 

Sbjct: 891 gcgcggccggccgc 904 
CDS 63.. 1460 



>gi | 20544351 | ref |XM_005702.8 | Homo sapiens wingless- type MMTV integration site 
family, member 8B (VJNT8B) , mRNA 
Identities = 14/14 (100%) 

Query: 477 gcgcggccggccgc 490 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 808 gcgcggccggccgc 821 
CDS 12 9.. 1184 

>gi|23452045|gb|AF494409.l| Homo sapiens pantothenate kinase 2 mRNA, complete 
cds 

Identities = 15/15 (100%) 



Query: 480 cggccggccgcctct 494 

]{ 1 1 M l i 1 1 1 1 1 1 1 

Sbjct: 279 cggccggccgcctct 265 
CDS 7.. 1719 



gi| 2213644 | gb [ U63833 . 1 | HSU63833 Human PAX6 gene, promoter region and exons 1 
and 2 

Identities = 16/16 (100%) 
Query: 482 gccggccgcctctgct 497 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 114 gccggccgcctctgct 129 
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promoter 



1. .3274 



/note= n isoform 2 is encoded by transcript variant 2; ortholog of mouse CNR5; 
KIAA0345-like l n 

>gi | 14589892 | ref | NM_001794 . 2 | Homo sapiens cadherin 4, type 1, R-cadherin 
(retinal) (CDH4) , mRNA 
Identities = 15/15 (100%) 

Query: 483 ccggccgcctctgct 497 

IMIIIIMIIIIII 

Sbjct: 2841 ccggccgcctctgct 2827 
CDS 15.. 2765 

This gene is a classical cadherin from the cadherin superfamily. The encoded 
protein is a calcium- dependent cell-cell adhesion glycoprotein, studies 

>gi | 11545830 | ref | NM_022114 . 1 | Homo sapiens PR domain containing 16 (PRDM16) , 
mRNA/ Identities = 15/15 (100%) 

Query: 483 ccggccgcctctgct 497 



>gi | 14165396 | ref | NM_031865 . 1 | Homo sapiens protocadherin alpha 13 (PCDHA13), 
transcript variant 2, 
Identities = 16/16 (100%) 

Query: 484 cggccgcctctgctgc 499 

iMiiiiilinilii 

Sbjct: 2268 cggccgcctctgctgc 2253 
CDS 1..2424 

>gi|l269731l|emb[AJ295990.l|HSA295990 Homo sapiens mRNA for putative chromatin 
modulator, alternative splice NSD3L 
Identities = 15/15 (100%) 

Query: 485 ggccgcctctgctgc 499 

IMIIIIMIIIIII 

Sbjct: 4514 ggccgcctctgctgc 4528 

CDS 314.. 4627 

/note= M alternative splice NSD3L" 

<gi| 12642816 |gb|AF332469.l|AF332469 Homo sapiens putative protein WHSC1L11 
(WHSC1L1) mRNA, complete cds, alternatively spliced 
Identities = 15/15 (100%) 

Query: 485 ggccgcctctgctgc 499 



>gi | 17474463 | ref | XM_062506 . 1 | Homo sapiens similar to 60S acidic ribosomal 
protein P2 (LOC121193) , mRNA 
Identities = 15/15 (100%) 

Query: 485 ggccgcctctgctgc 499 





IMIIIIIIIIIIII 



Sbjct: 278 ggccgcctctgctgc 292 
CDS 1..351 

product= "similar to 60S acidic ribosomal protein P2 n 
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>gi | 22035673 | ref |NM_006031. 2 | Homo sapiens pericentrin 2 (kendrin) (PCNT2) , 
mRNA 

Score = 30.2 bits (15), Expect s 88 
Identities = 15/15 (100%) 

Query: 487 ccgcctctgctgcag 501 

Mill MM Mill 

Sbjct: 3442 ccgcctctgctgcag 3428 

CDS 53.. 10063 

The protein encoded by this gene binds to calmodulin and is expressed in the 
centrosome . 

>gi| 12620204 | gb | AF288398 . 1 | AF288398 Homo sapiens Clorfl4 mRNA, complete cds 
Identities - 16/16 (100%) 

Query: 489 gcctctgctgcagatg 504 

1 1 1 1 1 1 1 1 1 1 1 1 1 M I 

Sbjct: 1282 gcctctgctgcagatg 1267 

CDS 69.. 2246 

note="alternatively spliced" 

>gi|9622520|gb|AF173157.l|AF173157 Homo sapiens MSTP098 (MST098) mRNA, 
complete cds 

Identities = 16/16 (100%) 
Query: 489 gcctctgctgcagatg 504 

III MM III Mill 

Sbjct: 329 gcctctgctgcagatg 314 
CDS 239.. 460 

>gi | 22046810 | ref |XM_089096 . 2 | Homo sapiens similar to coxsackievirus and 
adenovirus receptor- like protein (LOC163724) , mRNA 
Identities = 15/15 (100%) 

Query: 490 cctctgctgcagatg 504 

minimum 

Sbjct: 578 cctctgctgcagatg 564 
CDS 291. .1466 

misc_f eature 552 . . 674 

>gi | 20070194 | ref |NM_006140 . 2 | Homo sapiens colony stimulating factor 2 
receptor, alpha, low- affinity (granulocyte -macrophage) (CSF2RA) , mRNA 
Identities = 17/18 (94%) 

Query: 512 tctgcgaccagtggcacc 529 

I M i 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 248 tctgcgaacagtggcacc 265 

CDS 171.. 1373 

>gi|l5990415|gb|BC015569.l|BC015569 Homo sapiens, Similar to SRp25 nuclear 
protein, 

Identities « 14/14 (100%) 
Query: 517 gaccagtggcaccg 430 

II M I II 1 1 II II I . 

Sbjct: 406 gaccagtggcaccg 419 
CDS 37.. 684 

>gi|l3624213|gb|AF319045.l|AF319045 Homo sapiens contactin-associated protein 
2 (CNTNAP2) mRNA, complete 
Identities = 14/14 (100%) 
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Query: 517 gaccagtggcaccg 530 

iiiiiiiiiiiiii 

Sbjct: 2778 gaccagtggcaccg 2791 
CDS 141.. 4136 



>gi | 14702161 | ref |NM_032421.1 1 Homo sapiens cytoplasmic linker 2 (CYLN2) , 
transcript variant 2, 
Identities =14/14 (100%) 

Query: 519 ccagtggcaccgcc 532 

iiiiiiiiiiiiii 

Sbjct: 314 ccagtggcaccgcc 327 
CDS 328.. 3363 

note=" synonyms: WSCR4, WBSCR4, CLIP-115, KIAA0291, MGC11333" 
note= M isoform 2 is encoded by transcript variant 2; 
Williams -Beuren syndrome chromosome region 4" 

>gi | 22044320 | ref | XM_086178 . 5 | Homo sapiens agrin (AGRN) , mRNA 
Identities = 14/14 (100%) 

Query: 419 ccagtggcaccgcc 432 

iiiiiiiiiiiiii 

Sbjct: 4325 ccagtggcaccgcc 4338 

CDS 366.. 6107 

>gi 1 4885506 | ref |NM_005468 . 1 | Homo sapiens N-acetylated alpha-linked acidic 
dipeptidase-like; ILEAL DIPE PTIDYLPE PTTDASE (NAALADASEL) , mRNA 
Identities = 14/14 (100%) 

Query: 520 cagtggcaccgccg 533 

iiiiiiiiiiiiii 

Sbjct: 1156 cagtggcaccgccg 1169 

CDS 17.. 2239 

/ functions "peptidase " 

>gi 1 23943861 1 ref |NM_020378 . 1 [ Homo sapiens K562 cell-derived leucine - zipper- 
like protein 1 (KLP1) , mRNA 
Identities = 15/15 (100%) 
Query: 523 tggcaccgccgccgg 538 

MINIMUM 

Sbjct: 486 tggcaccgccgccgg 500 
CDS 90.. 710 

note="K562 cells-derived leucine- zipper- like protein 1" 

>gi|20384683|gb|AY030095.l| Homo sapiens pancreasin mRNA/ complete cds 
Identities a 17/17 (100%) 

Query: 524 ggcaccgccgccggccg 540 

iiiiiiiiiiiiiini 

Sbjct: 23 ggcaccgccgccggccg 7 

CDS 1..873 
note="CAPH2; channel -activating protease 2; tryptic serine protease; similar to 
marapsin" 

>gi | 20552317 | ref |XM_096904 .4 | Homo sapiens Kruppel-like factor 13 (KLP13) , 
Identities = 15/15 (100%) 

Query: 525 gcaccgccgccggcc 539 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 20 gcaccgccgccggcc 34 
CDS 47.. 913 
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note=" synonyms: BTEB3, FKLF2, NSLP1, FKLF-2 , RFLAT1, RFLAT-1" 
/product="similar to Krueppel-like factor 13 

>gi| 14727714 | ref |XM_045113.l| Homo sapiens astrotactin (ASTN) , mRNA 
Identities = 15/15 (100%) 



Query: 525 gcaccgccgccggcc 539 

I Mill MM Mill 

Sbjct: 72 gcaccgccgccggcc 58 

CDS 15.. 3899 

products" similar to KIAA0289" 



>gi 1 22538424 | ref | NM_145691 . 2 | Homo sapiens ATP synthase mitochondrial Fl 
complex assembly factor 2 (ATPAF2) , nuclear gene encoding mitochondrial protein, 
Identities = 14/14 (100%) 



Query: 525 gcaccgccgccggc 538 

1 1 1 1 1 1 1 

Sbjct: 947 gcaccgccgccggc 960 
CDS 154.. 1023 



>gi 1 22065230 | ref |XM_035037.2 | Homo sapiens low density lipoprotein receptor- 
related protein 4 (LRP4) , mRNA 
Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

i M 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 2107 caccgccgccggcc 2120 

CDS 232.. 4839 

product^ "similar to MEGF7" 



>gi | 20545806 | ref |XM_007095 . 6 | Homo sapiens insulin receptor substrate 2 
(IRS2) , mRNA 

Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

lliilililiini 

Sbjct: 3613 caccgccgccggcc 3626 
CDS 516.. 4532 



>gi | 4506228 | ref |NM_002809 .l| Homo sapiens proteasome (prosome, macropain) 26S 
subunit, non-ATPase, 3 (PSMD3) , mRNA 
Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 237 caccgccgccggcc 250 
CDS *" 158.. 17 62 



>gi|l657753|gb|U63721.l|HSU63721 Human elastin (ELN) gene, partial cds, and 
LIM-kinase (LIMK1) gene, 
Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

■ " ■ ' mi i n i in mi 

Sbjct: 23610 caccgccgccggcc 23597 
exon 23511.. 23730 

/gene=°LIMKl» 



>gi|582355l|gb|AF180522.l|AF180522 Homo sapiens intersectin short form 2 
(ITSN) mRNA, partial cds 
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Identities = 14/14 (100%) 
Query: 526 caccgccgccggcc 539 

IIIIIIIIIIIIM 

Sbjct: 158 caccgccgccggcc 171 
CDS <1..566 

>gi| 181652 |gb|M85247.l|HUMD0PAM H . sapiens dopamine D1A receptor gene, complete 
exon 1, and exon 2, 5 % end 
Identities = 14/14 (100%) 

Query: 531 ccgccggccgttct 543 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1097 ccgccggccgttct 1110 

misc_signal 842 . . 1231 

functions "negative trancriptional modulator" 

>gi|23395757|tpg|BK000395.l| TPA: Homo sapiens aflatoxin Bl-aldehyde reductase 
(AKR7A2) mRNA, 
Identities = 14/14 (100%) 

Query: 544 tcgccaccgcccag 567 

IIIIIIIIIIIIM 

Sbjct: 312 tcgccaccgcccag 299 

CDS 23 . . 1102 

/note="aldo-keto reductase; serves as a gamma -hydroxybutyrate synthase; the 
full-length protein is predicted to contain 29 additional amino acids at the 
N-terminus that have not been recognized previously" 

>gi | 7706102 | ref |NM_016568 . 1 1 Homo sapiens G-protein coupled receptor SALPR; 
somatostatin andangiotensin-like peptide receptor (SALPR) , mRNA 
Identities = 14/14 (100%) 

Query: 547 ccaccgcccagaag 560 

IIIIIIIIIIIIM 

Sbjct: 781 ccaccgcccagaag 768 

CDS 361.. 1770 

misc_f eature 697 . .1527 

riote="7tm_l; Region: 7 transmembrane receptor (rhodopsin 
family) " 

>gi | 18568985 | ref | XM_095373 . 1 ] Homo sapiens similar to Neutrophil defensin 4 
precursor (HNP-4) (HP4) (Defensin, alpha 4) (LOC157295) , mRNA 
Identities = 14/14 (100%) 

Query: 552 gcccagaagcagcc 565 

IIIIIIIIIIIIM 

Sbjct: 181 gcccagaagcagcc 194 

CDS 1..375 
misc_f eature 145.. 243 

>gi 1 22053899 1 ref | XM_092083 . 2 | Homo sapiens similar to golgi autoantigen, 
golgin subfamily a, 2; golgin-95 (LOC163220) , mRNA 
Identities = 14/14 (100%) 

Query: 552 gcccagaagcagcc 565 

IIIIIIIIIIIIM 

Sbjct: 505 gcccagaagcagcc 518 
CDS 1..1452 
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>gi 1 22053411 1 ref |XM_050604.4 | Homo sapiens AIE-75 binding protein protein 
(MCC2) , mRNA 

Identities = 14/14 (100%) 



Query: 553 cccagaagcagccc 566 

iiiiiiiniiiii 

Sbjct: 407 cccagaagcagccc 420 
CDS 114.. 2225 

>gi | 4505326 | ref |NM_000263 . 1 1 Homo sapiens N- acetyl glucosaminidase, alpha - 
(Sanfilippo disease IIIB) (NAGLU) , mRNA 
Identities - 17/18 (94%) 



Query: 553 gcccagaagcagcccgcc 569 

Minimi mini 

Sbjct: 1609 gcccagaagctgcccgcc 1626 

CDS 333.. 2564 

/function= "one of four enzymes involved in the degradation of heparan sulfate; 
specifically removes the alpha -N-acetylglucosamine residues" 

>gi 1 15718672 | ref | NM_0OO683 . 2 | Homo sapiens adrenergic, alpha-2C- # receptor 
(ADRA2C) , mRNA 
Identities = 14/14 (100%) 



Query: 553 cccagaagcagccc 566 

1 1 1 ill 1 1 1 1 1 1 1 1 

Sbjct: 2530 cccagaagcagccc 2517 

CDS 892,. 2277 

/not e= « alpha2 -AR-C4" 

/product = " alpha - 2 C - adr energi c receptor " 



>gi 1 15812179 1 ref )NM_004926.2 | Homo sapiens zinc finger protein 36, C3H type- 
like 1 (ZFP36L1) , mRNA 
Identities = 15/15 (100%) 



Query: 553 cccagaagcagcccg 578 

] 1 1 1 ] 1 1 1 1 1 1 1 1 1 1 

Sbjct: 432 cccagaagcagcccg 446 
CDS 131.. 1147 

/note="EGF- response factor 1; early response factor Berg36; zinc finger protein, 

C3H type, 36-like 1" 

/products "butyrate response factor 1" 

>gi | 20556994 | ref | XM_039877 . 5 1 Homo sapiens mucin 5, subtype B, 
tracheobronchial (MUC5B) , mRNA 
Identities = 17/18 (94%) 



Query: 555 cagaagcagcccgccgcc 572 

! 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 

Sbjct: 1580 cagaagcagccctccgcc 1563 
CDS 46.. 2688 



/db_xref="MIM:600770" 

>gi 1 22060317 1 ref | XMJL14498 . 2 | Homo sapiens similar to Tcte-1 peptide 
(LOC202500) , mRNA 
Identities =14/14 (100%) 

Query: 556 agaagcagcccgcc 569 

iiimiiniiii 

Sbjct: 1317 agaagcagcccgcc 1330 
CDS 346.. 1401 
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>gi 1 4505032 |ref |NM_000752.l| Homo sapiens leukotriene B4 receptor (LTB4R) , 
Identities = 19/20 (95%) /note="Chemokine receptor-like 1 

Query: 559 agcagcccgccgccggcgca 578 

Mill Mill llllll III 

Sbjct: 2595 agcaggccgccgccggcgca 2576 CDS: 1718.. 2776 



>gi 1 1648869 |emb|X98356.l|HSGPCRCO H. sapiens mRNA for 6 protein- coupled 
receptor 

Identities m 19/20 (95%) 

Query: 559 agcagcccgccgccggcgca 578 

Mill llllllllllllll 

Sbjct: 1266 agcaggccgccgccggcgca 1247 CDS: 389.. 1447 

>gi|5032110|ref |NM_005634.l| Homo sapiens SRY (sex determining region Y) -box 3 
(SOX3), mRNA 

Identities = 15/15 (100%) 
Query: 559 agcagcccgccgccg 573 

i ] 1 1 [ 1 1 1 1 1 1 i 1 1 1 

Sbjct: 862 agcagcccgccgccg 876 
CDS 1..1332 

>gi | 20548635 | ref | XMJL67923 . 1 1 
Identities = 14/14 (100%) 

Query: 560 gcagcccgccgccg 573 

llllllllllllll 

Sbjct: 116 gcagcccgccgccg 129 
CDS 49.. 843 

>gi | 8923792 | ref ] NM_017514 . 1 | 
(PLXN3) , mRNA 
Identities = 14/14 (100%) 

Query: 561 cagcccgccgccgg 574 

llllllllllllll 

Sbjct: 2896 cagcccgccgccgg 2909 
CDS 185.. 5800 

>gi|924712l|gb|AF284224.l|AF284224 Homo sapiens DMRT2 and terra-like protein 
(DMRT2) bicistronic mRNA, 
Identities = 16/16 (100%) 

Query: 561 cagcccgccgccggcg 576 

lllllliillllllll 

Sbjct: 111 cagcccgccgccggcg 126 

CDS 1..681 
/not e= "putative transcription factor" 

>gi| 6179565 |emb|Y19052.l|HOSA19052 Homo sapiens mRNA for double sex -like 2 
protein (DSXL-2 gene) 
Identities = 16/16 (100%) 
Strand = Plus / Plus 

Query: 561 cagcccgccgccggcg 576 

lllllliillllllll 

Sbjct: 565 cagcccgccgccggcg 580 



Homo sapiens horaeobox protein Gsh-1 (Gsh-1) , 



Homo sapiens likely ortholog of mouse plexin 3 
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CDS 



455. .1135 



Homo sapiens PTEN induced putative kinase 1 



>gi | 14165271 | ref | NM_032409 . 1 | 
(PINK1), mRNA 
Identities = 14/14 (100%) 

Query: 561 cagcccgccgccgg 574 

iiiiiiiiiiini 

Sbjct: 213 cagcccgccgccgg 200 

CDS 95.. 1840 

/note= "protein kinase BRPK" 

>gi | 21536278 | ref |NM_006371.2 | 
(CRTAP) , mRNA 
Identities = 14/14 (100%) 

Query: 562 agcccgccgccggc 575 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 295 agcccgccgccggc 308 

CDS 12.. 12 17 

The human cartilage associated protein is homologous to the chick and mouse 
CRTAP genes. 



Homo sapiens cartilage associated protein 



Homo sapiens interleukin 13 receptor, alpha l 



Homo sapiens sorcin (SRI) , mRNA 



>gi 1 4504646 | ref |NM_001560 . 1 1 
(IL13RA1) , mRNA 
Identities = 15/15 (100%) 

Query: 564 cccgccgccggcgca 578 

i i 1 1 1 1 1 1 : 1 1 ! 1 1 ] 

Sbjct: 103 cccgccgccggcgca 89 
CDS 44.. 1327 

>gi 1 4507206 | ref |NM_003130 . 1 1 
Identities = 14/14 (100%) 

Query: 564 cccgccgccggcgc 577 

iiiiiiiiiinii 

Sbjct: 48 cccgccgccggcgc 35 
CDS 13.. 609 

>gi | 21735549 | ref |NM_002446 . 2 | Homo sapiens mitogen -activated protein kinase 
kinase kinase 10 (MAP3K10) , mRNA 
Identities - 15/15 (100%) 

Query: 576 cagcccgccgccggc 590 

1 1 1 1 1 M 1 1 1 1 1 1 1 1 

Sbjct: 2885 cagcccgccgccggc 2899 
CDS 289.. 3153 

/note= "mixed lineage kinase 2; MKN28 kinase; MKN28 derived 
nonreceptorjiype serine /threonine kinase" 

>gi 1 18548972 | ref | XM_089318 . 1 1 Homo sapiens similar to ATP-dependent DNA 
helicase MER3 (HFM1 protein) (LOC164045) , mRNA 
Identities = 14/14 (100%) 



Query: 580 ttcttcccgccgcc 593 

iiiiiiiiiinii 

Sbjct: 67 ttcttcccgccgcc 80 
CDS 1..2196 
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>gi| 13929461 | ref |NM_001497 .2 | Homo sapiens UDP-Gal :betaGlcNAc beta 1,4- 
galactosyl transferase, polypeptide 1 (B4GALT1) , mRNA 
Identities = 14/14 (100%) 

Query: 581 tcttcccgccgccg 595 

miiiimiiii 

Sbjct: 73 tcttcccgccgccg 60 
CDS 73.. 1269 

>gi | 21359847 | ref |NMJ)01194 .2 | Homo sapiens hyperpolarization activated cyclic 
nucleotide -gated potassium channel 2 (HCN2) , mRNA 
Identities = 14/14 (100%) 

Query: 581 tcttcccgccgccg 594 

llilllilliiiii 

Sbjct: 2191 tcttcccgccgccg 2204 

CDS 54.. 2723 

functions "pacemaker channel of human heart" 

note= n cyclic nucleotide -gated; brain cyclic nucleotide gated channel 2" 

>gi|l8032269|gb|AF274003.l|AF274003 Homo sapiens splicing- related factor RNPS1 
(RNPS1) mRNA, complete cds, alternatively spliced 
Identities = 14/14 (100%) 

Query: 581 tcttcccgccgccg 594 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 46 tcttcccgccgccg 33 
CDS 46.. 894 

>gi | 4504382 | ref |NM_001528 . 1 | Homo sapiens HGP activator (HGFAC) , mRNA 
Identities = 15/15 (100%) 

Query: 590 cgccgttcttctcgc 604 

1 1 1 1 [[ 1 1 1 1 1 M 1 1 

Sbjct: 1828 cgccgttcttctcgc 1814 
CDS 4.. 1971 

>gi[ 14196470 | ref |NM_032054 . 1 | Homo sapiens protocadherin gamma subfamily A, 5 
(PCDHGA5) , transcript variant 2, mRNA 
Identities = 14/14 (100%) 

Query: 600 ctcgccgttcttct 613 

llllllllllllll 
Sbjct: 2416 ctcgccgttcttct 2403 

CDS 1..2442 

cadherin ME3 n 

/protein_id= "NP_114443 .1" 

These gene clusters have an immunoglobulin- like organization, suggesting that a 
novel mechanism may be involved in their regulation and expression. 

>gi | 19923446 | ref |NM_015963 .2 | Homo sapiens CGI-36 protein (CGI-36) , mRNA 
Identities » 14/14 (100%) 

Query: 600 ctcgccgttcttct 613 

llllllllllllll 

Sbjct: 947 ctcgccgttcttct 934 
CDS 807 . . 1565 

>gi|21314399|gb|AF508782.l| Homo sapiens fibroblast growth factor 10 (FGF10) 
mRNA, partial cds 
Identities = 14/14 (100%) 
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Query: 604 ccgttcttctcaat 617 

IIIIIIMIIIIII 

Sbjct: 173 ccgttcttctcaat 160 
CDS <1..513 

/functions "paracrine growth factor for epithelia" 
/note= n keratinocyte growth factor-2; KGF2; produced by 
fibroblasts of urinary bladder lamina propria" 

>gi | 22058975 | ref | XM_172182 . l| Homo sapiens similar to Ribosomal protein S5; 
Minute (1)15D? Minute; transcript e (LOC255793) , mRNA 
Identities = 14/14 (100%) 

Query: 606 gttcttctcaatgg 619 

IIIIIIMIIIIII 

Sbjct: 405 gttcttctcaatgg 392 
CDS 1..438 

>gi 1 24797096 | ref | NM_006907 . 2 | Homo sapiens pyrrol ine- 5 -carboxy late reductase 1 
(FYCRl) , nuclear gene encoding mitochondrial protein, transcript variant 
1, mRNA 

Identities =14/14 (100%) 
Query: 607 ttcttctcaatgga 620 

IIIIIIMIIIIII 

Sbjct: 598 ttcttctcaatgga 585 

CDS 279.. 1238 

/note= "isoform l is encoded by transcript variant 1; P5C 
reductase" 

>gi | 4186165 |gb|L41919.l|HUMHIClG Homo sapiens candidate tumor suppressor HIC-1 
(HIC-1) gene, complete 
Identities = 20/21 (95%) 

Query: 626 cgccccggccgcgccgcccgc 646 

1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 MM 

Sbjct: 2451 cgccccggccgcgccggccgc 2431 CDS : 637.. 2781 

Isolation and embryonic expression of the novel mouse gene Hicl,the homologue of 
HIC1, a candidate gene for the Miller-Dieker syndrome 

>gi | 23238250 | ref |NM_032862 . 2 | Homo sapiens tigger transposable element derived 
5 (TIGD5) mRNA, 
Identities = 18/19 (94%) 

Query: 626 cgccccggccgcgccgccc 644 

1 1 1 1 1 1 1 1 M llllllll 

Sbjct: 510 cgccccggccccgccgccc 528 
CDS 1..1782 

>gi| 17939629 |gb|BC019288.l|BC019288 Homo sapiens, hepatocyte nuclear factor 3, 
beta, clone 

Identities = 18/19 (94%) 

Query: 626 cgccccggccgcgccgccc 644 

MM I II MM 1 1 II III 

Sbjct: 284 cgccccggccgagccgccc 266 

CDS <1..1370 
/product= "hepatocyte nuclear factor 3, beta" 

>gi | 22041040 | ref | XM_092478 . 2 | Homo sapiens similar to Gliacolin (IiOC165257) , 
mRNA 
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Identities = 21/23 (91%) 

Query: 628 ccccggccgcgccgoccgccaco 650 

llllllll llllllll Mill 

Sbjct: 810 ccccggccccgccgcccaccacc 788 

CDS 471.. 1262 

/product=" similar to Gliacolin" 

>gi| 17974541 |gb|AF361354.l|AF361354 Homo sapiens voltage -dependent calcium 
channel gamma- 8 subunit (CACNG8) mRNA, complete cds 
Identities = 16/16 (100%) 

Query: 628 ccccggccgcgccgcc 643 

iiiiiiiiiniiiii 

Sbjct: 1132 ccccggccgcgccgcc 1117 
CDS 106.. 138 6 

>gi | 24475868 | ref |NM_153836 . 1 | Homo sapiens cellular repressor of E1A- 
stimulated genes 2 (CREG2) , 
Identities = 19/20 (95%) 

Query: 628 ccccggccgcgccgcccgcc 647 

iiiiiiiiiinii him 

Sbjct: 177 ccccggccgcgccggccgcc 158 
CDS 139.. 1011 

>gi|21237772 | ref |NM_016431.2 | Homo sapiens mitogen-activated protein kinase 8 
interacting protein 2(MAPK6IP2), transcript variant 2, mRNA 
Identities = 19/19 (100%) 

Query: 629 cccggccgcgccgcccgcc 547 

MM I Mill I llllll II 

Sbjct: 1276 cccggccgcgccgcccgcc 1294 
CDS 1..2394 

/note="PRKM8 interacting protein- like; 0NK> interacting protein 2; islet-brain 2; 

JNK MAP kinase scaffold protein JIP2; homologous to mouse JIP-1" 

>gi 1 14971412 | ref | NM_015906 .2 | Homo sapiens tripartite motif -containing 33 
(TRIM33) , transcript variant alpha, mRNA 
Identities = 16/16 (100%) 

Query: 629 cccggccgcgccgccc 644 

IIMMMIIIIIMI 

Sbjct: 267 cccggccgcgccgccc 252 
CDS 85.. 3468 

>gi|l3183792 | gb | AF336133 . 1 | AF336133 Homo sapiens CECR2 protein (CECR2) mRNA, 
complete cds 

Identities = 16/16 (100%) 
Query: 629 cccggccgcgccgccc 644 

M 1 1 1 1 f 1 1 1 1 1 1 1 1 1 

Sbjct: 448 cccggccgcgccgccc 433 

CDS 419". .4873 

>gi|22046663 | ref |XM_047536.6 | Homo sapiens obscurin, cytoskeletal calmodulin 
and titin- interacting RhoGEF (OBSCN) , mRNA 
Identities = 15/15 (100%) 

Query: 631 cggccgcgccgcccg 645 

1 1 1 1 1 1 1 1 1 1 1 M 1 1 

Sbjct: 572 cggccgcgccgcccg 558 
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CDS 45.. 18518 

/products "similar to obscurin" 

>gi|21707308|gb|BC033826.l| Homo sapiens, purinergic receptor P2X f ligand- 
gated ion channel, 4, clone MGC: 45331 IMAGE: 5216449, mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 632 ggccgcgccgcccgc 646 

illllllllllllll 

Sbjct: 24 ggccgcgccgcccgc 10 

CDS 25.. 1191 

/product^ "purinergic receptor P2X, ligand-gated ion channel, 4* 

>gi | 21450823 | ref |NM_145056. 1 1 Homo sapiens thymus expressed gene 3 -like 
(MGC15476) , mRNA 
Identities = 16/16 (100%) 

Query: 632 ggccgcgccgcccgcc 647 

IIIIIIIIIIIIIMI 

Sbjct: 879 ggccgcgccgcccgcc 894 
CDS 441. .1655 

>gi|22652729|gb|AF489858.1| Homo sapiens serum amyloid A activating factor 2 
mRNA, complete cds 
Identities = 16/16 (100%) 

Query: 632 ggccgcgccgcccgcc 647 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 550 ggccgcgccgcccgcc 565 

CDS 113.. 1594 

/note=" transcription factor SAF-2" 

>gi | 20558544 | ref |XM_028783.2 ] Homo sapiens opioid growth factor receptor 
(OGFR) , mRNA 

Identities = 15/15 (100%) 
Query: 632 ggccgcgccgcccgc 646 

illllllllllllll 

Sbjct: 174 ggccgcgccgcccgc 160 
CDS 17.. 2050 

/product=" similar to 7-60 protein" 

>gi 1 22042730 1 ref |XM_114346.2 | Homo sapiens similar to source of immunodominant 
MHC-associated peptides (LOC201595) , mRNA 
Identities = 15/15 (100%) 

Query: 633 gccgcgccgcccgcc 647 

illllllllllllll 

Sbjct: 345 gccgcgccgcccgcc 331 
CDS 200.. 2680 

/product=" similar to source of immunodominant MHC-associated peptides" 

>gi 1 4507162 | ref |NM_003107 . 1 1 Homo sapiens SRY (sex determining region Y) -box 4 
(SOX4), mRNA 
- Identities = 16/16 (100%) 

Query: 634 ccgcgccgcccgccac 64 9 

IIIIIIIIIIIIIMI 

Sbjct: 972 ccgcgccgcccgccac 957 
CDS 351.. 1775 
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gl|23395757|tpg|BK000395.l| TPA: Homo sapiens aflatoxin Bl-aldehyde reductase 
(AKR7A2) mRNA, 
Identities = 18/19 (94%) 



Query: 640 cgcccgccaccgccgcggc 658 

MINIM IMIIIIII 

Sbjct: 180 cgcccgccagcgccgcggc 198 
CDS 23 . . 1102 



>gi|5032110|ref |NM_005634.l| Homo sapiens SRY (sex determining region Y) -box 3 
(SOX3), mRNA 

Identities = 18/18 (100%) 



Query: 641 gcccgccaccgccgcggc 658 

MMMIMMMMMI 

Sbjct: 1044 gcccgccaccgccgcggc 1061 
CDS 1..1332 



>gi 1 20589957 | ref |NM_139075 . 1 | Homo sapiens two-pore calcium channel protein 2 
(TPC2) , mRNA 

Identities = 15/15 <100%) 



Query: 643 ccgccaccgccgcgg 657 

I M 1 1 1 1 1 1 1 M I M 

Sbjct: 160 ccgccaccgccgcgg 146 
CDS 102.. 2360 



>gi | 16753218 | ref |NM__033224.2 | Homo sapiens purine-rich element binding protein 
B (PURB) , mRNA 
Identities = 15/15 (100%) 



Query: 643 ccgccaccgccgcgg 657 

MMMMMMMI 

Sbjct: 480 ccgccaccgccgcgg 466 
CDS 14 . . 952 



>gi 1 291945 |gb|L12398.l|HUMD4C Homo sapiens dopamine receptor D4 (DRD4) mRNA, 
complete cds 

Identities = 15/15 (100%) 



Query: 643 ccgccaccgccgcgg 657 

MMMMMMMI 

Sbjct: 502 ccgccaccgccgcgg 488 
CDS 1..1404 



>gi | 19401873 |gb|AF479827.l| Homo sapiens protein kinase-like protein mRNA, 

complete cds 

Identities = 18/19 (94%) 



Query: 644 cgccaccgccgcggctggg 662 

IMMMMM 1 1 1 1 1 1 1 

Sbjct: 1907 cgccaccgccggggctggg 1889 
CDS 278.. 2614 



>gi|7542578|gb|AF241229.l|AP241229 Homo sapiens GITR-D mRNA, complete cds 
Identities = 15/15 (100%) 



Query: 651 gccgcggctgggccc 665 

MMMMMMMI 

Sbjct: 682 gccgcggctgggccc 696 CDS: 1..768 
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>gi | 23238193 | ref |NM_148901 . 1 1 Homo sapiens tumor necrosis factor receptor 
superfamily, member 18 (TNFRSF18) , transcript variant 2, mRNA 
Identities = 15/15 (100%) 

Query: 652 gccgcggctgggccc 666 

MM I MMI II Ml 

Sbjct: 820 gccgcggctgggccc 834 CDS: 139.. 906 

>gi 1 11038623 | ref |NM_004426 . 1 1 Homo sapiens polyhomeotic-like 1 (Drosophila) 
(PHC1) , mRNA 

Identities = 15/15 (100%) 
Query: 671 tcttcacccttgtct 685 

llllllllllillll 

Sbjct: 1644 tcttcacccttgtct 1658 

CDS 210.. 3224 

/note="early development regulator 1; mouse Rae28-like" 
>gi|l90395|gb|M60494.l|HUMPROFILA Human profilaggrin gene, 3» end 
Identities = 15/15 (100%) 

Query: 678 ccttgtcttcgtcca 692 

llllllllllillll 

Sbjct: 4236 ccttgtcttcgtcca 4222 
exon 949.-4447 
CDS 1478.. 4447 

>gi | 24475953 | ref |NM_013433 .2 | Homo sapiens karyopherin beta 2b f transportin 
(TRN2) , mRNA 

Identities = 14/14 (100%) 

Query: 678 ccttgtcttcgtcc 691 

I I I II I I I I I I I I I 
Sbjct: 2026 ccttgtcttcgtcc 2013 

CDS 2 92.. 2955 

/note="hypothetical protein FLJ12155" 

>gi | 8923472 | ref |NM_017852 . l| Homo sapiens NALP2 protein (NALP2) , mRNA 
Identities = 15/15 (100%) 

Query: 685 ttcgtccacgtctag 699 

llllllllllillll 

Sbjct: 453 ttcgtccacgtctag 439 

CDS 88.. 3276 

/note= "PYRIN- Containing APAFl-like" 

>gi|l0198206|gb|AF298547.l| Homo sapiens nucleotide -binding site protein 1 
mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 685 ttcgtccacgtctag 699 

llllllllllillll 

Sbjct: 425 ttcgtccacgtctag 411 

CDS 78.. 3179 

/note="NBSl; nucleotide -binding site/ leucine- rich repeat 
(NBS/LRR) family member" 

>gi | 4504576 | ref | NM_002164 . 1 | Homo sapiens indoleamine-pyrrole 2,3 dioxygenase 
(INDO) , mRNA 

Identities = 17/17 (100%) 

Query: 691 cacgtctagttctggga 707 
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iiiiiiiiiiiiiini 

Sbjct: 258 cacgtctagttctggga 274 
CDS 23. .1234 

>Numatrin) pseudogene and the MDFI gene for MyoD family inhibitor (myogenic 
repressor I-MF 
Identities = 15/15 (100%) 

Query: 697 tagttctgggacctc 711 

1 1 f 1 1 r 1 1 1 m 1 1 1 ( 

Sbjct: 64761 tagttctgggacctc 64775 

CDS complement (64067 . . 64810) 

/note= n dJ696P19.2 (NPM1 (Nuclecphosmin, Numatrin) pseudogene) 

>gi | 22047835 | ref | XM_095174 . 3 | Homo sapiens similar to pol protein (LOC168550) , 
mRNA 

Identities = 14/14 (100%) 
Query: 699 gttctgggacctcc 712 

lllllllllll III 

Sbjct: 1249 gttctgggacctcc 1262 
CDS 1..3315 

>gi | 4506508 | ref |NM_002926 . 1 | Homo sapiens regulator of G-protein signalling 12 
(RGS12), mRNA 
Identities = 15/15 (100%) 

Query: 700 ttctgggacctcccg 714 

1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 2786 ttctgggacctcccg 2772 CDS: 55.. 4185 

>gi| 22771013 |gb|AF542391.l| Homo sapiens selectin P (granule membrane protein 
140kDa, antigen CD62) (SELP) gene, complete cds 
Identities = 17/18 (94%) 

Query: 705 ggacctcccgctcaagag 722 

MINIM MINIMI 

Sbjct: 6869 ggacctcctgctcaagag 6886 
gene <l. ,>398 

>gi | 4758621] ref | NMJ504770 . 1 1 Homo sapiens potassium voltage-gated channel, 
Shab-related subfamily, member 2 (KCNB2) , mRNA 
Identities = 14/14 (100%) 

Query: 711 cccgctcaagagcc 724 

1 1 1 1 r r 1 1 1 1 1 1 1 1 

Sbjct: 1329 cccgctcaagagcc 1316 

CDS 3.. 2423 

>gi|21595817|gb|BC032731.l| Homo sapiens, Wolf-Hirschhorn syndrome candidate 
1, Identities = 14/14 (100%) 

Query: 713 cgctcaagagccag 726 

I ) 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1876 cgctcaagagccag 1889 
source 1..4239 

>gi|l9172410|gb|AP480461.l| Homo sapiens mixed lineage kinase -related kinase 
MRK- alpha mRNA, 
Identities = 14/14 (100%) 

Query: 715 ctcaagagccagtg 728 
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Sbjct: 2454 ctcaagagccagtg 2467 
CDS 196.. 2598 

>gi|23272700|gb|BC035910.l| Homo sapiens, mitogen- activated protein kinase 
kinase kinase 7 interacting protein 2, 
Identities = 14/14 (100%) 

Query: 727 tggtacaccagaag 740 

i I [ 1 1 1 1 1 1 j i j 1 1 

Sbjct: 1758 tggtacaccagaag 1771 
CDS 149.. 2230 

>gi | 10947029 | ref | NMJ)06217 . 2 | Homo sapiens serine (or cysteine) proteinase 
inhibitor, clade I (neuroserpin) , member 2 (SERPINI2 ) , mRNA 
Identities = 19/20 (95%) 

Query: 73 7 gaagtctacttttttttcta 756 

i in minim him 

Sbjct: 927 gaagtctactttttgttcta 908 
CDS 34.. 1251 

>gi|24638453 | ref |NM_170665.l| Homo sapiens ATPase, Ca++ transporting, cardiac 
muscle, slow twitch 2 (ATP2A2) , mRNA 
Identities = 14/14 (100%) 

Query: 765 actttgtcaccaac 778 

IIIIMIMIIII I 

Sbjct: 586 actttgtcaccaac 573 
CDS 111.. 3239 

>gi 1 21536291 1 ref |NM_001081.2 | Homo sapiens cubilin (intrinsic factor- cobalamin 
receptor) (CUBN) , 
Identities = 14/14 (100%) 

Query: 765 actttgtcaccaac 778 

iiiiiiiiiiiiii 

Sbjct: 8029 actttgtcaccaac 8042 

CDS 27.. 10898 

/note=" intrinsic factor- cobalamin receptor; intrinsic factor B12 -receptor" 

>gi | 6912355 | ref |NM_012155 . 1 | Homo sapiens echinoderm microtubule associated 
protein like 2 (BML2) , 
Identities = 14/14 (100%) 

Query: 766 ctttgtcaccaact 779 

iiiiiiiiiiiiii 

Sbjct: 1595 ctttgtcaccaact 1608 
CDS 36.. 1985 

>gi 1 18597004 | ref |XM_051693 .4 | Homo sapiens mitogen inducible 2 (MIG2), mRNA 
Identities = 15/15. (100%) 

Query: 768 ttgtcaccaacttct 782 

i iiiiiiiiiiiiii 

Sbjct: 838 ttgtcaccaacttct 852 
CDS: 238.. 2280 

>gi| 3335149 |gb|AF055377.l|AF055377 Homo sapiens long form transcription factor 
C-MAF (c-maf) mRNA, 
Identities - 15/15 (100%) 
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Query: 771 tcaccaacttctcgt 785 

iiiiiiiiiiiiiii 

Sbjct: 1864 tcaccaacttctcgt 1850 
CDS 808.. 2019 

/note= M b-zip transcription factor" 

>gi|7304920|ref | NM_0 13449 . 1 | Homo sapiens bromodomain adjacent to zinc finger 
domain, 2A (BA22A) , 
Identities = 14/14 (100%) 

Query: 800 tgagtggaggacta 813 

! 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1587 tgagtggaggacta 1600 
CDS 740.. 6376 

>gi| 5419653 |emb|AL034553. 12 (HS914P20 Human DNA sequence from clone RP5-914P20 
on chromosome 20ql3 .13-13 .2 Contains the gene for activity-dependent 
neuroprotective protein {ADNP, KIAA0784) , a PSMD10 (proteasome (prosome, 
macropain) 26S subunit, non-ATPase, 10) pseudogene, the DPMI gene fo> 
Identities » 19/20 (95%) 

Query: 803 gtggaggactaataagactt 822 

IIIMIIIMIII 1 1 1 1 1 1 

Sbjct: 10723 gtggaggactaatgagactt 10704 misc_f eature: 10509.. 10953 

>gi| 14388625 |gb|AF243083.l|F243081S03 Homo sapiens intrinsic factor-vitamin 
B12 receptor (CUBN) gene, exons 5 and 6 
Identities = 16/16 (100%) 

Query: 817 gacttatatactgtcc 832 

llllllllllllllll 

Sbjct: 809 gacttatatactgtcc 824 
CDS AP243 085. 1:692. .854 

>gi|24527258|gb|AY071904.l| Homo sapiens ribonuclease/angiogenin inhibitor 
(RNH) mRNA, complete 
Identities = 17/18 (94%) 

Query: 824 atactgtccgttctttga 841 

llllllll lllllllll 

Sbjct: 532 atactgtcagttctttga 515 
CDS 1..1386 

>gi | 9558724 |ref|NM_013291.l| Homo sapiens cleavage and polyadenylation 
specific factor 1, 160kDa (CPSF1) , mRNA 
Identities ■ 14/14 (100%) 

Query: 834 ttctttgagggagg 847 

lllllllll Mill 

Sbjct: 1313 ttctttgagggagg 1300 
CDS 52.. 4380 

>gi 1 20143921 1 ref |NM_133437.1 | Homo sapiens titin (TTN) , transcript variant 
novex-2, mRNA * 
Identities = 14/14 (100%) 

Query: 838 ttgagggaggacct 851 

llllllllllllll 

Sbjct: 56027 ttgagggaggacct 56014 
CDS 224.. 81580 
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/notes "isoform novex-2 is encoded by transcript variant 
novex-2; connect in; CMH9, included" 

Query: 839 tgagggaggacctc 852 

Mllllllllllll 

Sbjct: 819 tgagggaggacctc 832 

CDS 100.. 1155 

/product-" similar to ARP2/3 complex 41 kDa subunit (P41-ARC) (Actin- related 
protein 2/3 complex subunit IB) B 

>gi | 21426828 | ref | NM_144773 . 1 | Homo sapiens G protein- coupled receptor 73-like 
1 (GPR73Iil) , mRNA 
Identities » 14/14 (100%) 

Query: 848 gacctccctatgga 861 

llllllllllllll 

Sbjct: 100 gacctccctatgga 113 CDS: 1..1155 

>gi|21327026|gb|AF506288.l| Homo sapiens prokineticin receptor 2 (PKR2) mRNA, 
complete cds 

Identities = 14/14 (100%) 
Query: 848 gacctccctatgga 861 

Mllllllllllll 

Sbjct: 100 gacctccctatgga 113 CDS 1..1155 

>gi|766954l|ref |NM_013992 . 1 | Homo sapiens paired box gene 8 (PAX8) , transcript 
variant PAX8E, 
Identities - 14/14 (100%) 

Query: 84 9 acctccctatggac 862 

llllllllllllll 

Sbjct: 582 acctccctatggac 595 CDS 161.. 1024 

>gi | 16160856 | ref |XM_007763 .5 | Homo sapiens myosin VA (heavy polypeptide 12, 
myoxin) (MY05A) , mRNA 
Identities = 19/20 (95%) 

Query: 863 cgtaactggagagtctgggg 882 

Mill IMMMMIMM 

Sbjct: 724 cgtaagtggagagtctgggg 743 

CDS 245. .5812 

/product=" similar to Myosin Va (Myosin 5A) (Dilute myosin 
heavy chain, non-muscle) (Myosin heavy chain 12) (Myoxin)" 

>gi 1 4757807 | ref | NMJ501683 . 1 1 Homo sapiens ATPase, Ca++ transporting, plasma 
membrane 2 ( ATP2B2 ) , 
Identities = 15/15 (100%) 

Query: 865 taactggagagtctg 879 

Illllllllllllll 
Sbjct: 1298 taactggagagtctg 1312 

CDS 577.. 4173 

/note="PMCA-2" 

>gi | 16904386 | ref |NM_013363 .2 | Homo sapiens procollagen C-endopeptidase 
enhancer 2 { PCOLCE2 ) , mRNA 
Identities = 14/14 (100%) 

Query: 867 actggagagtctgg 880 

Mllllllllllll 
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Sbjct: 308 actggagagtctgg 321 
CDS 197 . . 1444 

>gi|7706548 |ref |NMJ)16507 .1 | Homo sapiens CDC2-related protein kinase 7 
(CRK7), mRNA 

Identities = 15/15 (100%) 
Query: 868 ctggagagtctgggg 882 

llliiiinillill 

Sbjct: 2092 ctggagagtctgggg 2078 

CDS 34.. 4506 

>gi | 24850118 | ref | NMJL70605 . 1 1 Homo sapiens PDZ domain protein (Drosophila 
inaD-like) (INADL) , mRNA 
Identities = 14/14 <100%) 

Query: 868 ctggagagtctggg 881 

iiiiiiiiiniii 

Sbjct: 1570 ctggagagtctggg 1557 
CDS 1..5406 

>gi | 21536251 | ref | NM_015678 . 2 | Homo sapiens neurobeachin (NBEA) , mRNA 
Identities = 14/14 (100%) 
Strand = Plus / Plus 

Query: 868 ctggagagtctggg 879 

1 1 : 1 1 1 1 r 1 1 1 1 1 

Sbjct: 3008 ctggagagtctggg 3021 
CDS 207.. 9047 

>gi|21434742 | gb | AF467288 . 1 1 Homo sapiens BCL8B protein (BCL8B) mRNA, complete 
Identities = 14/14 (100%) 

Query: 868 ctggagagtctggg 881 

MM llllll MM 

Sbjct: 3008 ctggagagtctggg 3021 
CDS 207.. 9047 

>gi | 7662409 | ref |NM_014963 . 1 1 Homo sapiens KIAA0963 protein (KIAA0963) , mRNA 
Identities = 15/15 (100%) 

Query: 868 ctggagagtctgggg 882 

] 1 1 1 1 1 1 M I M 1 1 1 

Sbjct: 2832 ctggagagtctgggg 2846 CDS 216.. 4316 

>gi | 22041826 | ref |XM_172259 . 1 | Homo sapiens similar to 60S ribosomal protein 
L21 (LOC255888) , mRNA 
Identities = 16/16 (100%) 
Query: 869 tggagagtctggggtt 884 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 530 tggagagtctggggtt 545 
CDS 1..579 

>gi| 17157996 1 ref |NM_058167.1 1 Homo sapiens ubiqui tin- conjugating enzyme E2 f J2 
(UBE2J2), mRNA 
Identities = 14/14 (100%) 

Query: 870 ggagagtctggggt 883 

iiiiiiiiiniii 

Sbjct: 652 ggagagtctggggt 639 
CDS 205.. 879 
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>gi | 23308602 | ref |NM_015460 . 1 | Homo sapiens myosin VIIA and Rab interacting 
protein (MYRIP) , raRNA 
Identities = 15/15 (100%) 

Query: 871 gagagtctggggttc 885 

IMIIMII Mill! 

Sbjct: 1861 gagagtctggggttc 1847 
CDS . 137. .2716 

>gi | 6912705 1 ref |NM_012455 .1 | Homo sapiens SEC7 homolog (TIC), raRNA 
Identities = 14/14 (100%) 

Query: 872 agagtctggggttc 885 

Mi II I II II III I 

Sbjct: 762 agagtctggggttc 749 

CDS 64.. 3234 

/note= n ADP-ribosylation factor guanine nucleotide -exchange 
factor 6" 

>gi | 22051239 | ref |XM_048346 . 4 | Homo sapiens insulin receptor (INSR) , mRNA 
Identities = 14/14 (100%) 

Query: 884 tcgttgaccgtctt 897 

Milium in 

Sbjct: 3251 tcgttgaccgtctt 3238 
CDS 181.. 42 18 

>gi 1 4507600 | ref |NM_003807. 1 | Homo sapiens tumor necrosis factor (ligand) 
superfamily, member 14 (TNFSF14 ) , mRNA 
Identities - 14/14 (100%) 

Query: 901 cggtct tact t egg 914 

Ml 'II III I 

Sbjct: 742 cggtcttacttcgg 755 
CDS 49.. 771 

>gi| 2745709 |gb|U89310.l|AH005788S02 Homo sapiens nucleophosmin phosphoprotein 
(NPM) gene, exon 2 
Identities = 14/14 (100%) 

Query: 908 acttcggttctttt 921 

llllllllllllll 
Sbjct: 411 acttcggttctttt 424 CDS U89311. 1:416 . .535 

>gi | 20521002 | dbj |AB002333.2| Human mRNA for KIAA0335 gene, partial cds 
Identities = 18/18 (100%) 

Query: 914 gttctttttaatttcttc 931 

II II! II II 1 1 II MM! 

Sbjct: 216 gttctttttaatttcttc 233 CDS <829..5283 

>gi | 19923778 | ref |NM_006479 . 2 | Homo sapiens RAD51- interacting protein (PIR51) , 
mRNA 

Identities = 16/16 (100%) 
Query: 915 ttctttttaatttctt 930 

1 1 1 1 11 1 1 1 1 1 M 1 1 1 

Sbjct: 703 ttctttttaatttctt 688 
CDS 51.. 1058 
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>gi | 4505610 | ref |NM_002582.l| Homo sapiens poly (A) -specif ic ribonuclease 
(deadenylation nuclease) (PARN) , mRNA 
Identities » 16/16 (100%) 

Query: 915 ttctttttaatttctt 930 

I I I I I I I I I I I I I I I I 
Sbjct: 1897 ttctttttaatttctt 1882 
CDS 58.. 1977 

>gi | 20538519 | ref |XM_057659 . 6 | Homo sapiens similar to RIKEN cDNA 2310005N03 
(LOC116228) , mRNA 
Identities = 18/18 (100%) 

Query: 915 ttctttttaatttcttct 932 

I I I I I I I I I I II I I II I I 
Sbjct: 629 ttctttttaatttcttct 612 CDS 337. .693 

>gi | 18579348 | ref | XM_090294 . 1 1 Homo sapiens similar to 10- 
formyltetrahydrofolate dehydrogenase (LOC160428) , mRNA 
Identities « 19/19 (100%) 

Query: 916 tctttttaatttcttctac 934 

Mill IIIMIIIMIIII 

Sbjct: 2263 tctttttaatttcttctac 2245 CDS 1. .2928 

>gi | 4503510 | ref |NM_003758. 1 | Homo sapiens eukaryotic translation initiation 
factor 3, subunit 1 alpha, 35kDa (EIF3S1) , mRNA 
Identities = 17/17 (100%) 

Query: 916 tctttttaatttcttct 932 

IIIIIIIIMIIIIIII 

Sbjct: 352 tctttttaatttcttct 336 CDS 61.. 837 

>gi|2327190l|gb|BC036021.l| Homo sapiens, Similar to Bmp2 -inducible kinase, 
Identities = 20/21 (95%) 

Query: 917 ctttttaatttcttctactac 937 

II I II 1 1 Mill MM MM 

Sbjct: 796 ctttttaatttcttcttctac 776 
CDS 128.. 2116 

>gi | 18375633 | ref |NM_004639 . 2 | Homo sapiens HLA-B associated transcript 3 
(BAT3), transcript variant 1, mRNA 
Identities = 15/15 (100%) 

Query: 931 ctactacgaggttct 945 
I I ) I I 1 I 1 I I I I I I I 

Sbjct: 1172 ctactacgaggttct 1186 CDS 285.. 3683 

>gi | 17485359 | ref | XM_066371. 1 | Homo sapiens L0C129184 (LOC129184) , mRNA 
Identities = 16/16 (100%) 

Query: 1016 tgtgggtgccagggtc 1031 

. . '.. Ill.lllllllllllll . . 

Sbjct: 866 tgtgggtgccagggtc 851 CDS 1..960 

>gi|l2653994 [ gb (BC000795 . 1 | BC000795 Homo sapiens, hypothetical protein 
Identities = 15/15 (100%) 

Query: 1017 gtgggtgccagggtc 1031 

iiniiiiiiiiiii 
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Sbjct: 306 gtgggtgccagggtc 292 CDS 49.. 1260 

>gi| 1668741 |emb|X90762.1 |HSHHA5GEN Homo sapiens hHaS gene 
Identities » 16/16 (100%) 

Query: 1018 tgggtgccagggtctc 1033 

Mill Mil l 1 1 III 

Sbjct: 1215 tgggtgccagggtctc 1230 exon 1112.. 1365 nuraber=8 

>gi| 18582587 |ref |XM_090689. 1 | Homo sapiens similar to S antigen precursor - 

malaria parasite (Plasmodium falciparum) (strain Wellcome) (LOC161088) , 

mRNA 

Identities = 19/20 (95%) 

Query: 1019 gggtgccagggtctcaggtg 1038 

MINIMI 1 1 1! 1 1 1 1 1 1 

Sbjct: 372 gggtgccagcgtctcaggtg 353 CDS 1..1221 Chr. 13 

>gi|9863549|emb|AL1577l8.10| Human DNA sequence from clone RP11-23013 on 
chromosome 20 Contains a putative novel gene, a CpG island, ESTs and GSSs, 
complete sequence [Homo sapiens] 
Identities = 19/20 (95%) 

Query: 1021 gtgccagggtctcaggtgca 1040 

1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 MM 

Sbjct: 40364 gtgccagggtctcagctgca 40345 

misc_feature complement (40329. .4 0883} note="match: GSS: Etn:AQ606491 M 

>gi| 35258 |emb|X13345.l|HSPAI19 Human gene for plasminogen activator inhibitor 
1 (PAI-1) exon 9/ Identities = 19/20 (95%) 

Query: 1024 ccagggtctcaggtgcagac 1043 

iiiii Milium mm 

Sbjct: 264 ccagggtctcaggtggagac 245 
precursor_RNA <1..1835 /note= "primary transcript" 

>gi | 18581862 | ref | XM_090590 . 1 | Homo sapiens LOC160925 (LOC160925) , mRNA 
Identities = 15/15 (100%) 

Query: 1064 agcaactctcgagtt 1078 

1 1 1 1 1 1 1 1 1 1 1 1 1 ! 

Sbjct: 374 agcaactctcgagtt 360 CDS 1..870 

>gi|24660383|gb|BC039025.l| Homo sapiens, Similar to tyrosine 3- 
monooxygenase/tryptophan 5-monooxygenase activation protein, epsilon 
polypeptide, clone MGC:47805 IMAGE: 6070099, mRNA, 
Identities = 17/17 (100%) 

Query: 1077 tttcgattttgctgtgg 1093 

III II Mill II 

Sbjct: 58 tttcgattttgctgtgg 74 
CDS 107.. 8 83 

>gi 1 18253109 1 dbj |AB065437.l| Homo sapiens Cls gene for complement Cls, 
promoter' region and exon 1 
Identities = 15/15 (100%) 

Query: 1112 ttttcgggaaagtca 1124 (Exon wechsel) 

1 1 1 1 1 1 M 1 1 1 1 1 1 1 

Sbjct: 2584 ttttcgggaaagtca 2570 
promoter 1 . . 2826 
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/functions "complement activation" 
exon 2827. .2978 

>gi | 22047240 | ref |XM_175003 . l| Homo sapiens LOC2 5 6 626 (LOC256626) , mRNA 
Identities » 15/15 (100%) 

Query: 1785 gaaaagtgacctgaa 1799 

iiiiiii iiiiiiii 

Sbjct: 1768 gaaaagtgacctgaa 1754 CDS 1..1914 

>gi|ll990557|gb|AF170052.l|AF170052 HIV-2 isolate 97227 from France envelope 
glycoprotein (env) gene, partial cds 
Identities = 15/15 (100%) 

Query: 1825 gtatggcctctgtcc 1839 

1 1 1 1 1 1 1 1 1 1 1 1 1 ii 

Sbjct: 866 gtatggcctctgtcc 852 CDS <1..>2243 

>gi 1 4502528 | ref |NM_000721.l| Homo sapiens calcium channel, voltage -dependent, 
alpha IE subunit (CACNA1E) , mRNA, note= "brain specific" 
Identities = 15/15 (100%) 

Query: 1827 atggcctctgtccgg 1841 

MINIMI IMIII 

Sbjct: 1433 atggcctctgtccgg 1419 CDS 166.. 6921 

>gi | 20559017 | ref |XM_166786 . l| Homo sapiens similar to SUMO-1 activating enzyme 
subunit 1; SUMO-1 activating enzyme El N subunit; sentrin/SUMO-activating 
protein A0S1; ubiqui tin -like protein SUMO-1 activating enzyme (LOC220311) , mRNA 
Identities = 16/16 (100%) 

Query: 1842 gatacacacggggaag 1857 

1 1 1 ! 1 1 1 1 1 1 1 1 1 1 

Sbjct: 886 gatacacacggggaag 901 CDS 1..1134 

/ gene="LOC220311">gi| 4758617 | ref |NM_004693.l| Homo sapiens cytokeratin type II 
(K6HF) , mRNA 

Identities = 16/16 (100%) 

Query: 1845 acacacggggaagctg 1860 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 366 acacacggggaagctg 351 CDS 19.. 1674 

>gi| 17149843 | ref |NM_057092.l| Homo sapiens FK506 binding protein 2, 13kDa 
(FKBP2), transcript variant 2, mRNA 
Identities = 14/14 (100%) 

Query: 1847 acacggggaagctg 1860 

I II I Mill 1 1 III 

Sbjct: 269 acacggggaagctg 282 
CDS 103.. 531 

misc_f eature 223 504 

/note="FKBP; Region: FKBP-type pept idyl -prolyl cis-trans isomerase" 

>gi | 20127426 | ref |NM_002252 . 2 1 Homo sapiens potassium voltage-gated channel, 
delayed-rectifier, subfamily S, member 3 (KCNS3), mRNA 
Identities = 15/15 (100%) 

Query: 1847 acacggggaagctgc 1861 

mm. nil ii 

Sbjct: 653 acacggggaagctgc 667 
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>gi | 24981010 |gb|BC039695.l| Homo sapiens, Janus kinase 2 (a protein tyrosine 
kinase) , clone 
Identities = 14/14 (100%) 

Query: 1865 cattattcttcaaa 1878 

iiiiiiiiiiiiii 

Sbjct: 3354 cattattcttcaaa 3341 
CDS 108.. 3497 

>gi 1 20149552 1 ref |NM_004414 . 3 | Homo sapiens Down syndrome critical region gene 
1 (DSCR1) , mRNA 
Identities = 15/15 (100%) 

Query: 1872 cttcaaacgagtcag 1886 

I I II I I I I I I M I I I 
Sbjct: 215 cttcaaacgagtcag 229 
CDS 66.. 659 

>gi|6648540|gb|U53821.l|HSU53821 Homo sapiens adapt78 protein gene, partial 
Identities = 15/15 (100%) 

Query: 1872 cttcaaacgagtcag 1886 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 219 cttcaaacgagtcag 233 
CDS 70..>562 

>gi 1 8922685 | ref | NM_018228 . 1 1 Homo sapiens hypothetical protein FLJ10811 
(FLJ10811) , mRNA 
Identities = 17/17 (100%) 

Query: 1955 ctggaagagctggggcc 1971 

I IN II 1 1 MUM I II _ 

Sbjct: 923 ctggaagagctggggcc 907 CDS 146. .2254 

>gi|l729830l|gb|AF283402.l|F283327S74 Homo sapiens candidate tumor suppressor 
protein (LRP1B) gene, exon 76 
Identities = 17/17 (100%) 

Query: 2034 ttcttaaaatttttact 2050 

M I M 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 307 ttcttaaaatttttact 291 CDS 
join(AF283376 . 1: <285 . . 407, AF283377 

>gi 1 20545629 | ref | XM_121159 . 1 1 Homo sapiens LOC206321 (LOC206321) , mRNA 
Identities = 25/28 (89%) 

Query: 2133 agatagaacgagacattagagcaaagtt 2161 

1 1 1 1 1 1 1 1 1 1 M I I lllllllllll n ma , 

Sbjct: 527 agatagaacgagatctgagagcaaagtt 500 CDS i..±±/b 

>gi 1 22054646 1 ref |XM_069110 .2 | Homo sapiens similar to hypothetical protein 
FLJ23231 (LOC134973), mRNA 
Identities = 16/16 (100%) 

Query: 2155 caaagtttttgttcca 2170 

iiiiiiiiiiiiini , , A , K 

Sbjct: 915 caaagtttttgttcca 930 CDS 1..2475 
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>gi|6382057|ref |NM_007313 . l| Homo sapiens v-abl Abelson murine leukemia viral 
oncogene homolog 1(ABL1), transcript variant b, mRNA 
Identities = 18/18 (100%) 

Query: 2163 ttgttccacaaaaacatt 2180 

MMi I M' Mill M.I 

Sbjct: 135 ttgttccacaaaaacatt 118 CDS 1. .3447 

>gi|3095l03|gb|AF044579.l|AF044579 Homo sapiens translocation related non- 
coding gene (TNRG10) mRNA, complete sequence 
Identities a 17/17 (100%) 

Query; 2164 tgttccacaaaaacatt 2180 

iiiiiimiiiiiiii 

Sbjct: 2361 tgttccacaaaaacatt 2345 
gene 1..2726 
repeat_region 326.. 547 
repeat_region 2599. .2709 

Intron (BB/SHR) 

>gi|5453963 |ref |NM_006251.l| Homo sapiens protein kinase, AMP -activated, alpha 
1 catalytic subunit (PRKAA1) , mRNA 

Identities = 16/16 (100%) 



Query: 316 tcttctgagcactcaa 331 

llllllllllllllll 

Sbjct: 943 tcttctgagcactcaa 928 

CDS 24.. 1676 

note=»"AMPK alpha 1; Protein kinase, AMP -activated, catalytic, alpha-l" 

>gi 1 23503326 1 ref |NM_018682 . 2 | Homo sapiens myeloid/ lymphoid or mixed-lineage 
leukemia 5 (trithorax homolog, Drosophila) (MLL5) , mRNA 
Identities = 16/16 (100%) 

Query: 365 catcagatgaaggatc 380 

llllllllllllllll 

Sbjct: 1003 catcagatgaaggatc 988 

CDS 202.. 5778 

/note=" contains PHD and SET domains; similar to Drosophila trithorax" 
/products "myeloid/lymphoid or mixed-lineage leukemia 5 

>gi|l418773|emb|X97186.l|HSE14 H. sapiens mRNA for E14 protein 
Identities = 17/17 (100%) 

Query: 428 gaagacaaagagttctt 444 

iiiiiiiiiiiiniii 

Sbjct: 1509 gaagacaaagagttctt 1493 

CDS 35.. 4318 

>gi|l381666|gb|U58852.l|HSTJ58852 Human NPAT mRNA, complete cds 
Identities = 17/17 (100%) 

Query: 428 gaagacaaagagttctt 444 
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iiiiiiiiiiiiniii 

Sbjct: 1475 gaagacaaagagttctt 1459 

CDS 1..3528 
/note= "predicted amino acids have three regions which share similarity to 
annotated domains of transcriptional factor oct-1, nucleolus -cytoplasm shuttle 
phosphoprotein and protein kinases" 

>gi | 22065878 1 ref |XM_040846.5 | Homo sapiens nuclear protein, ataxia- 
telangiectasia locus (NPAT) , 
Identities = 17/17 (100%) 

Query: 428 gaagacaaagagttctt 444 

lllilllllllllllll 

Sbjct: 1509 gaagacaaagagttctt 1493 

CDS 35 ..4318 

/product= "similar to NPAT" 

>gi 1 18079322 | ref |NM__080612 . 1 1 Homo sapiens GRB2 -associated binding protein 3 
(GAB3), ItlRNA 

Identities = 17/17 (100%) 

Query: 578 ggggtccaagaccagag 594 

lllilllllllllllll 

Sbjct: 1254 ggggtccaagaccagag 1238 

CDS 33.. 1793 

/function="diff erentiation signaling" 

>gi 1 20270211] ref |NM_033396. 1 | Homo sapiens tankyrase 1 binding protein 1, 
182kDa (TNKS1BP1) , mRNA 

Identities = 16/16 (100%) 



Query: 583 ccaagaccagagtaaa 598 

iiiiiiiiiiiiini 

Sbjct: 2725 ccaagaccagagtaaa 2740 

CDS 308.. 5497 

/products "tankyrase 1-binding protein of 182 kDa" 

>gi | 21626462 | ref |NM_000038.2 | Homo sapiens adenomatosis polyposis coli (APC) , 
Identities = 16/16 (100%) 

Query: 616 gaccaaaaaggaactg 631 

1 1 ] 1 1 M 1 1 ! 1 1 1 1 1 1 

Sbjct: 8232 gaccaaaaaggaactg 8247 

CDS 39.. 8570 

/product="adenomatosis polyposis coli" 
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SEQUENZPROTOKOLL 



<110> Ernst-Moritz-Arndt-Universitat Greifswald 

<120> Verwendung des multifunktionellen Transkriptionsfaktors Yin-Yang-1 
land Varianten davon zur Behandlung von Erkrankungen, insbesondere von Typ-1 
Diabetes 

<130> P 62096 

<160> 8 

<170> Pateritln version 3.1 

<210> 1 

<211> 2256 

<212> DNA 

<213> Rattus norv. 

<220> 

<221> CDS 



<222> (73) . . (1125) 
<223> YY1 (BB/OK) 



<220> 

<221> raisc__feature 

<222> (1759) . . (1917) 

<223> Zinkfinger 



<220> 

<221> mis cofeature 

<222> (955) . . (1125) 

<223> Zinkfinger 



<220> 

<221> Intron 

<222> (1126) . . (1758) 

<223> 



<220> 

<221> promoter 
<222> (1) • . (72) 
<223> 



<220> 

<221> CDS 

<222> (1759) . . (1938) 

<223> YY1 (BB/OK) 
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<400> 1 

ccgcctcctc gcccgccctc ccgcagccca ggagccgagg ctgccgcggc cgtggcggcg 60 

gagccctcag cc atg gcc teg ggc gac acc etc tac att gec acg gac ggc 111 
Met Ala Ser Qly Asp Thr Leu Tyr lie Ala Thr Asp Gly 
15 10 

teg gag atg cca gcc gag ate gtg gaa ctg cat gag att gag gtg gag 159 
Ser Glu Met Pro Ala Glu He Val Glu Leu His' Glu He Glu Val Glu 
15 20 25 

acc ate ccg gtg gag act ate gag acc acg gtg gtg ggc gag gag gag 207 
Thr He Pro Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu 
30 35 40 45 

gac gac gac gaa gac gac gag gat ggt ggc ggc gga gac cac ggt ggc 255 
Asp Asp Asp Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly 
50 55 ~ 60 

ggg ggc ggc cac ggg cac get ggc cac cac cat cac cac cac cac cac 303 
Gly Gly Gly His Gly His Ala Gly His His His His His His His His 
65 70 . 75 

cac cac ccg ccc atg ate gcg ctg cag ccg ctg gtc acc gac gac ccg 351 
His His Pro Pro Met He Ala Leu Glh Pro Leu Val Thr Asp Asp Pro 
80 85 90 

acc caa gtg cac cac cac caa gag gtg att ctg gtg cag acg cgc gag 399 
Thr Gin Val His His His Gin Glu Val He Leu Val Gin Thr Arg Glu 
95 100 105 

gag gta gtg ggt ggc gac gac teg gac ggg ctg cgc gcc gag gac ggg 447 
Glu Val Val Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly 
HO 115 120 ~ 125 

ttc gag gac cag ate etc att ccg gta ccc gcg ccg gcc ggc gga gac 495 
Phe Glu Asp Gin He Leu lie Pro Val Pro Ala Pro Ala Gly Gly Asp 
130 135 140 

gac gac tac ate gag cag acg ctg gtc acc gtg gcg gcg gcc ggc aag 543 
Asp Asp Tyr He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys 
145 150 155 

age ggt ggc ggg tct teg teg ggc ggc ggc cgc gtt aag aag ggc ggc 591 
Ser Gly Gly Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly 
160 165 " 170 

ggc aag aag age ggc aag aag agt tac ctg ggc age ggg gcc ggc gcg 639 
Gly Lys Lys Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala 
175 180 185 

gcg ggc ggt ggc ggc gcc gac ccg ggt aat aag aag tgg gaa cag aag 687 
Ala Gly Gly Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys 
190 195 200 205 

cag gtg cag ate aag acc ctg gag ggc gag ttc teg gtc acc atg tgg 735 
Gin Val Gin He Lys* Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp 
210 215 220 

tct tea gat gaa aaa aaa gat att gac cat gaa aca gtg gtt gaa gag 783 
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Ser Ser Asp Glu Lys Lys Asp lie Asp His Glu Thr Val Val Glu Glu 
225 230 235 

cag ate att ggg gag aac tea cct cct gat tat tct gaa tat atg aca 831 
Gin lie lie Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr 
240 245 250 

ggc aag aaa etc cct cct gga ggg ata cct ggc att gac etc tea gac 879 
Gly Lys Lys Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp 
255 260 265 

ccc aag caa ctg gca gaa ttt gec aga atg aag cca aga aaa att aaa 927 
Pro Lys Gin Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys 
270 275 280 285 

gaa gat gat get cca aga aca ata get tgc cct cat aaa ggc tgc aca 975 
Glu Asp Asp Ala Pro Arg Thr He Ala qys Pro His Lye Gly Cys Thr 
290 295 300 

aag atg ttc agg gat aac tct get atg aga aag cat ctg cac ace cac 1023 
Lys Met Phe Arg Asp Asn Ser Ala Met Arg Lys His Leu His Thr His 
305 * 310 315 

ggt ccc aga gtc cac gtc tgt gca gaa tgt ggc aaa gcg ttc gtt gag 1071 
Gly Pro Arg Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu 
320 325 330 

age tea aag eta aaa cga cac cag ctg gtt cat act gga gaa aag ccc 1119 
Ser Ser Lys Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro 
335 340 345 



ttt cag gtagagccag ttcctgttcc ccaaactgca agctagggtg ctggtcaggg 

Phe Gin 

350 


1175 


tggttgatat 


caagcactat 


ggggcacegg 


ttggggtatt 


ttattcccat 


ccctcctgtc 


1235 


tgcttgggtt 


cctggttact 


getegggact 


gcaggtgtta 


cagatggggg 


tggagggatt 


1295 


atgegaagea 


cccccacact 


aaatttctag 


caggtttaca 


aaaactcaac 


agttttgttt 


1355 


tgtagtgagt 


agtgtgttga 


attactgata 


gagtgettat 


aagtgctgtt 


ggctacagct 


1415 


ccaggtgaca 


cttggtgctg 


cttatagaag 


actcgtgagt 


tgacagttgg 


catcaetaaa 


1475 


tatcttaatc 


atctgtagtc 


tacttcctag 


agtgtctctg 


aaaacactca 


agctgtaaat 


1535 


ttgcactcag 


cacagccc'tt 


ctgtttctca 


agaactagee 


atgggttgtt 


agtatcagag 


1595 


atcccagtgt 


gtcagttcta 


aaataccctc 


agaagggttc 


cagacgagga 


aggaggcatg 


1655 


ctcagcagaa 


tagtaggtgg 


tttccatcta 


agcagtgagc 


catcgatccc 


caggttctgg 


1715 


tetcatttge 


caagagggtt 


gatatctggt 


ttttccttga 


cag tgc aca ttc gaa 
Cys Thr Phe Glu 
355 


1770 



ggc tgc ggg aag cgc ttt tea ctg gac ttc aat ttg cgc acg cat gtg 1818 
Gly Cys Gly Lys Atg Phe Ser Leu Asp Phe Asn Leu Arg Thr His Val 
360 365 370 
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cga ate cat acc gga gac agg ccc tat gtg tgc ccc ttc gac ggt tgt 1866 
Arg lie His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe Asp Gly Cys 
375 380 385 

aat aag aag ttt get cag tea act aac ctg aaa tct cac ate tta aca 1914 
Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys Ser His lie Leu Thr 
390 395 400 



cac get aaa gee aaa aac aac cag tgaaaagaag agagaagacc ttctcgaccc 1968 
His Ala Lys Ala Lys Asn Asn Gin 



405 




410 






egggaagect 


cttcaggagt 


gtgattggga 


ataaatatgc ctctcctttg tatattattt 


2028 


ctaggaagaa 


ttttaaaaat 


gaatcctaca 


cacttaaggg acatgttttg ataaagtagt 


2088 


aaaaatttaa 


aaaaatactt 


taataagatg 


acattgetaa gatgetctat ettgetctgt 


2148 


aatctcgttt 


caaaaacaag 


gtgtttttgt 


aaagtgtggc cccaacagga ggacaattca 


2208 


tgaacttege 


atcaaaagac 


aattctttat 


acaacagtgc taaaaatg 


2256 



<210> 2 

<211> 411 

<212> PRT 

<213> Rattus norv. 

<220> 

<221> mis cofeature 

<222> (1759) . . (1917) 

<223> Zinkfinger 

<220> 

<221> misc_feature 

<222> (955) (1125) 

<223> Zinkfinger 

<400> 2 

Met Ala Ser Gly Asp Thr Leu Tyr lie Ala Thr Asp Gly Ser Glu Met 
1 5 10 15 



Pro Ala Glu lie Val Glu Leu His Glu lie Glu Val Glu Thr lie Pro 
20 25 30 



Val Glu Thr lie Glu Thr Thr Val Val Gly Glu Glu Glu Asp Asp Asp 
35 40 45 



Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly 
50 55 60 



His Gly His Ala Gly His His His His His His His His His His Pro 
65 70 75 80 
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Pro Met He Ala Leu Gin Pro Leu Val Thr Asp Asp Pro Thr Gin Val 
85 90 95 

His His His Gin Glu Val lie Leu Val Gin Thr Arg Glu Glu Val Val 
100 105 HO 



Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly Phe Glu Asp 
115 120 125 



Gin He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp Asp Asp Tyr 
130 135 140 

He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys Ser Gly Gly 
145 150 155 160 



Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly Gly Lys Lys 
165 170 175 



Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala Ala Gly Gly 
180 185 190 



Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys Gin Val Gin 
195 " 200 205 



He Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp Ser Ser Asp 
210 215 220 



Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu Gin He He 
225 ' " 230 235 ' 240 



Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr Gly Lys Lys 
245 250 255 



Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp Pro Lys Gin 
260 265 270 



Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys Glu Asp Asp 
275 280 285 



Ala Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr Lys Met Phe 
290 295 300 



Arg Asp Asn Ser Ala Met Arg Lys His Leu His Thr His Gly Pro Arg 
305 310 315 320 
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Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu Ser Ser Lys 
325 330 335 



Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro Phe Gin Cys 
340 345 350 



Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg 
355 360 365 



Thr His Val Arg lie His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe 
370 375 380 



Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Ash Leu Lys Ser His 
385 390 395 400 



He Leu Thr His Aia Lys Ala Lys Asn Asn Gin 
405 410 



<210> 3 

<211> 2256 

<212> DNA 

<213> Rattus norv. 

<220> 

<221> CDS 

<222> (73) . . (1125) 

<223> YY1 (SHR) 



<220> 

<221> misc_feature 

<222> (1759) . . (1917) 

<223> Zinkfinger 



<220> 

<221> misc_feature 

<222> (955) . . (1125) 

<223> Zinkfinger 



<220> 

<221> Intron 

<222> (1126) . . (1758) 

<223> 



<220> 

<221> promoter 

<222> (1)..(72) 
<223> 
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<220> 

<221> CDS 

<r222> (1759) . . (1938) 

<223> YY1 (SHR> 



<400> 3 

ccgcctcctc gcccgccctc ccgcagccca ggagccgagg ctgccgcggc cgtggcggcg 60 

gagccctcag cc atg gcc teg ggc gac acc etc tac att gec acg gac ggc 111 
Met Ala Ser Gly Asp thr Leu Tyr lie Ala Thr Asp Gly 
1 5 10 

teg gag atg cca gcc gag ate gtg gaa ctg cat gag att gag gtg gag 159 
Ser Glu Met Pro Ala Glu lie Val Glu Leu His Glu lie Glu Val Glu 
15 20 25 

acc ate ccg gtg gag act ate gag acc acg gtg gtg ggc gag gag gag 207 
Thr He Pro Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu 
30 35 40 45 

gac gac gac gaa gac gac gag gat ggt ggc ggc gga gac cac ggt ggc 255 
Asp Asp Asp Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly 
50 55 60 

ggg ggc ggc cac ggg cac get ggc cac cac cat cac cac cac cac cac 303 
Gly Gly Gly His Gly His Ala Gly His His His His His His His His 
65 70 75 

cac cac ccg ccc atg ate gcg ctg cag ccg ctg gtc acc gac gac ccg 351 
His His Pro Pro Met He Ala Leu Gin Pro Leu Val Thr Asp Asp Pro 
80 85 90 

acc caa gtg cac cac cac caa gag gtg att ctg gtg cag acg cgc gag 399 
Thr Gin Val His His His Gin Glu Val He Leu Val Gin Thr Arg Glu 
95 100 105 

gag gta gtg ggt ggc gac gac teg gac ggg ctg cgc gcc gag gac ggg 447 
Glu Val Val Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly 
110 115 120 125 

ttc gag gac cag ate etc att ccg gta ccc gcg ccg gcc ggc gga gac 495 
Phe Glu Asp Gin He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp 
130 135 140 

gac gac tac ate gag cag acg ctg gtc acc gtg gcg gcg gcc ggc aag 543 
Asp Asp Tyr He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys 
145 150 155 

age ggt ggc ggg tct teg teg ggc ggc ggc cgc gtt aag aag ggc ggc 591 
Ser Gly Gly Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly 
"160 165 170 

ggc aag aag agt ggc aag aag agt tac ctg ggc age ggg gcc ggo gcg 639 
Gly Lys Lys Ser Gly Lys Lys Ser Tyr Leu Gly ser Gly Ala Gly Ala 
175 180 185 

gcg ggc ggt ggc ggc g;cc gac ccg ggt aat aag aag tgg gaa cag aag 687 
Ala Gly Gly Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys 
190 195 200 205 
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cag gtg cag ate aag acc ctg gag ggc gag ttc teg gtc acc atg tgg 735 
Gin Val Gin lie Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp 
210 215 220 

tct tea gat gaa aaa aaa gat att gac cat gaa aca gtg gtt gaa gag 783 
Ser Ser Asp Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu 
225 230 235 

cag ate att ggg gag aac tea cct cct gat tat tct gaa tat atg aca 831 
Gin He He Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr 
240 245 ~ * 250 

ggc aag aaa etc cct cct gga ggg ata cct ggc att gac etc tea gac 879 
Gly Lys Lys Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp 
255 260 265 

ccc aag caa ctg gca gaa ttt gcc aga atg aiag cca aga aaa att aaa 927 
Pro Lys Gin Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys 
270 275 280 " 285 

gaa gat gat get cca aga aca ata get tgc cct cat aaa ggc tgc aca 975 
Glu Asp Asp Ala Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr 
290 295 " 300 

aag agg ttc agg gat aac tct get atg aaa aag cat ctg c&c acc cac 1023 
Lys Arg Phe Arg Asp Asn Ser Ala Met Lys Lys His Leu His Thr His 
305 310 315 

ggt ccc aga gtc cac gtc tgt gca gaa tgt ggc aaa gcg ttc gtt gag 1071 
Gly Pro Arg Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu 
320 325 330 

age tea aag eta aaa cga cac cag ctg gtt cat act gga gaa aag ccc 1119 
Ser Ser Lys Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro 
335 340 345 

ttt cag gtagagccag ttcctgttcc ccaaactgca agctagggtg ctggtcaggg 1175 

Phe Gin 

350 



tggttgatat 


caagcactat 


ggggcacegg 


ttggggtatt 


ttattcccat 


ccctcctgtc 


1235 


tgcttgggtt 


cctggttact 


getegggact 


gcaggtgtta 


cagatggggg 


tggagggatt 


1295 


atgegaagea 


cccccacact 


aaatttctag 


caggtttaca 


aaaactcaac 


agttttgttt 


1355 


tgtagtgagt 


agtgtgttga 


attactgata 


gagtgettat 


aagtgctgtt 


ggctacagct 


1415 


ccaggtgaca 


cttggtgctg 


cttatagaag 


acacgtga$t 


tgacagttgg 


catcactaaa 


1475 


tatcttaatc 


atctgtagtc 


tacttcctag 1 


agtgtctctg 


aaaacactca 


agctgtaaat 


1535 


ttgcactcag 


cacagccctt 


ctgtttctca 


agaactagee 


atgggttgtt 


agtatcagag 


1595 


atcccagtgt 


gtcagttcta 


aaataccctc 


acaagggttc 


cagacgagga 


aiggaggectg 


1655 


ctcagcagaa 


tagtaggtgg 


tttccatcta 


agcagtgagc 


catcgatccc 


caggttctgg 


1715 


tetcatttge 


caagagggtt 


gatatctggt 


ttttccttga 


cag tgc aca ttc gaa 


1770 
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Cys Thr Phe Glu 
355 

ggc tgc ggg aag cgc ttt tea ctg gac ttc aat ttg cgc acg cat gtg 1818 
Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg Thr His Val 
360 365 370 

cga ate cat acc gga gac agg ccc tat gtg tgc ccc ttc gac ggt tgt 1866 
Arg He His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe Asp Gly Cys 
375 380 385 

aat aag aag ttt get cag tea act aac ctg aaa tct cac ate tta aca 1914 
Asn Lys Lys Phe Ala Gin Ser Thr Asn' Leu Lys Ser His He Leu Thr 
390 395 400 

cac get aaa gee aaa aac aac cag tgaaaagaag agagaagacc ttctcgaccc 1968 
His Ala Lys Ala Lys Asn Asn Gin 
405 410 

egggaagect cttcaggagt gtgattggga ataaatatgc ctctcctttg tatattattt 2028 

ctaggaagaa ttttaaaaat gaatcctaca cac'ttaaggg acatgttttg ataaagtagt 2088 

aaaaatttaa aaaaatactt taataagatg acattgetaa gatgetctat ettgetctgt 2148 

aatctcgttt caaaaacaag gtgtttttgt aaagtgtggt cccaacagga ggacaattca 2208 

tgaacttege atcaaaagac aattctttat acaacagtgc taaaaatg 2256 



<210> 


4 


<211> 


411 


<212> 


PRT 


<213> 


Rattus norv. 


<220> 




<221> 


misc feature 


<222> 


(1759) . . (1917) 


<223> 


Zinkfinger 


<220> 




<221> 


mis c_f eature 


<222> 


(955) . . (1125) 


<223> 


Zinkfinger 


<400> 


4 



Met Ala Ser Gly Asp Thr Leu Tyr He Ala Thr Asp Gly Ser Glu Met 
15 10 15 



Pro Ala Glu He Val Glu Leu His Glu He Glu Val Glu Thr He Pro 
20 25 30 



Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu Asp Asp Asp 
' 35 40 45 



Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly 
50 55 60 
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His Gly His Ala Gly His His His His His His His His His His Pro 
65 70 75 80 



Pro Met lie Ala Leu Gin Pro Leu Val Thr Asp Asp Pro Thr Gin Val 
85 90 95 



His His His Gin Glu Val He Leu Val Gin Thr Arg Glu Glu Val Val 
100 105 110 



Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly Phe Glu Asp 
115 120 125 



Gin He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp Asp Asp Tyr 
130 135 140 



He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys Ser Gly Gly 
145 150 155 150 



Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly Gly Lys Lys 
165 170 175 



Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala Ala Gly Gly 
180 185 190 



Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys Gin Val Gin 
195 200 205 



He Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Tfp Ser Ser. Asp 
210 215 220 



Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu Gin He He 
225 230 235 240 



Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr Gly Lys Lys 
245 250 255 



Leu Pro Pro Gly Gly lie Pro Gly He Asp Leu Ser Asp Pro Lys Gin 
260 265 270 



Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys Glu Asp Asp 
275 280 285 



Ala Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr Lys Arg Phe 
290 295 300 
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Arg Asp Asn Ser Ala Met Lys Lys His Leu His Thr His Qly Pro Arg 
305 310 315 320 



Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu Ser Ser Lys 
325 330 335 



Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro Phe Gin Cys 
340 345 350 



Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg 
355 360 365 



Thr Hie Val Arg He His Thr Gly Asp Arg Pro tyr Val Cys Pro Phe 
370 375 380 



Asp Gly Cys Asn Lys Lys Phe Ala Glri Ser thr Asn Leu Lys Ser His 
385 390 395 ^ 400 



He Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 



<210> 5 

<211> 1600 

<212> DNA 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43) . . (1284) 

<223> YY1 (Human) 



<400> 5 

gaattcggca cgagggcggc cgtggcggcg gagccctcag cc atg gcc teg ggc 54 

Met Ala Ser Gly 
1 

gac acc etc tac ate gcc acg gac ggc teg gag atg ccg gcc gag ate 102 
Asp Thr Leu Tyr He Ala Thr Asp Gly Ser Glu Met Pro Ala Glu He 
5 10 15 20 

gtg gag ctg cat gag ate gag gtg gag acc ate ccg gtg gag acc ate 150 
Val Glu Leu His Glu He Glu Val Glu Thr He Pro Val Glu Thr He 
25 30 35 

gag acc acg gtg gtg ggc gfag gag gag gag gag gac gac gac gac gag 198 
Glu Thr Thr Val Val Gly Glu Glu Glu Glu Glu Asp Asp Asp Asp Glu 
40 45 ~ 50 



WO 2004/056857 



12 



PCT/EP2003/014762 



gac ggc ggc ggc ggc gac cac ggc ggc ggc ggg ggc ggc cac ggg cac 246 
Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly Gly His Gly His 
55 60 65 

gcc ggc cac cac cat cac cac cac cac cac cac cac cac cac ccg ccc 294 
Ala Gly His His His His His His His His His His His His Pro Pro 
70 75 80 

atg ate gcg ctg gag ccg ctg gtg acg gac gac ccg acc caa gtg cac 342 
Met lie Ala Leu Glu Pro Leu Val Thr Asp Asp Pro Thr Gin Val His 
85 90 95 100 

cac etc cag gag gtg ate ctg gtg cag acg cgc gag gag gtc gtc ggg 390 
His Leu Gin Glu Val He Leu Val Gin Thr Arg Glu Glu Val Val Gly 
105 110 115 

ggg gac gac teg gac ggg ctg cgc gcc gag gac ggc ttc gag gac gag 438 
Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly Phe Glu Asp Glu 
120 125 130 

ate etc ate ccg gtg ccc gcg ccg gcc ggc ggc gac gac gac tac ata 486 
He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp Asp Asp Tyr He 
135 14 0 145 . 

gag cag acg ctg gtc acc gtg gcg gcg gcc ggc aag age ggc ggc ggg 534 
Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys Ser Gly Gly Gly 
150 155 160 

gcc teg teg ggc ggc ggt cgc gtg aag aag ggc ggc ggc aag aag age 582 
Ala Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly Gly Lys Lys Ser 
165 170 175 * 180 

ggc aag aag agt tac ctg ggc ggc ggg gcc ggc gcg gcg ggc ggc ggc 630 
Gly Lys Lys Ser Tyr Leu Gly Gly Gly Ala Gly Ala Ala Gly Gly Gly 
185 190 195 

ggc gcc gac ccg ggg aat aag aag tgg gag cag aag cag gtg cag ate 678 
Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys Gin Val Gin He 
200 205 210 

aag acc ctg gag ggc gag tec teg gtc acc atg tgg tec teg gat gaa 726 
Lys Thr Leu Glu Gly Glu Ser Ser Val Thr Met Trp Ser Ser Asp Glu 
215 220 ~ 225 

aaa aaa gat att gac cat gaa aca gtg gtt gaa gag cag ate att gga 774 
Lys Lys Asp He Asp His Glu Thr Val Val Giti Glu Gin He He Gly 
230 235 240 

gag aac tea cct cct gat tat tct gaa tat atg aca ggc aag aaa etc 822 
Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr Gly Lys Lys Leu 
245 250 255 ^ 260 

cct cct gga ggg ata cct ggc att gac etc tea gac cct aag caa ctg 870 
Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp Pro Lys Gin Leu 
265 ' 270 ~ 275 

gca gaa ttt gcc aga atg' aag cca aga aaa att aaa gaa gat gat get 918 
Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys Glu Asp Asp Ala 
280 285 ^ 290 
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cca aga aca ata get tgc cct cat aaa ggc tgc aca aag atg ttc agg 966 
Pro Arg Thr lie Ala Cys Pro His Lys Gly Cys Thr Lys Met Phe Arg 
295 300 305 

gat aac tct get atg aga aag cat ctg cac acc cac ggt ccc aga gtc 1014 
Asp Asn Ser Ala Met Arg Lys His Leu His Thr His Gly Pro Arg Val 
310 315 320 

cac gtc tgt gca gag tgt ggc aaa gcg ttc gtt gag age tea aag eta 1062 
His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu Ser Ser Lys Leu 
325 330 335 340 

aaa cga cac cag ctg gtt cat act gga gaa aag ccc ttt cag tgc aca 1110 
Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro Phe Gin Cys Thr 
345 350 355 

ttc gaa ggc tgc ggg aag cgc ttt tea ctg gac ttc aat ttg cgc aca 1158 
Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg Thr 
360 365 370 

cat gtg gga ate cat acc gga gac agg ccc tat gtg tgc ccc ttc gac 1206 
His Val Gly lie His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe Asp 
375 380 385 

ggt tgt aat aag aag ttt get cag tea act aac ctg aaa tct cac ate 1254 
Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys Ser His lie 
390 395 400 

tta aca cac get aaa gee aaa aac aac cag tgaaaa^aag agagaagacc 1304 
Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 

ttctcgaccc gggaagcetc ttcaggagtg agattgggaa taaatatgee tctcctttgt 1364 

atattatttc taggaagaat tttaaaaatg aatcctacac acttaaggga catgttttga 1424 

taaagtagta aaaatttaaa aaatacttta ataagatgac attgetaaga tgetatatet 1484 

tgctctgtaa tetegtttea aaaacaaggt gtttttgtaa agtgt^gtcc caacaggagg 1544 

acaattcatg aacttegcat caaaagacaa ttctttatac aacagtgeta aaaatg 1600 

<210> 6 

<211> 414 

<212> PRT 

<213> Homo sapiens 

<400> 6 

Met Ala Ser Gly Asp Thr Leu Tyr lie Ala Thr Asp Gly Ser Glu Met 
1 5 10 * ~ 15 

Pro Ala Glu lie Val Glu Leu His Glu lie Glu Val Glu Thr lie Pro 
20 25 30 

Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu Glu Glu Asp 
35 40 45 
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Asp Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly 
50 55 60 



Gly His Gly His Ala Gly His His His His His His His His His His 
65 70 75 80 



His His Pro Pro Met lie Ala Leu Glu Pro Leu Val Thr Asp Asp Pro 
85 90 95 



Thr Gin val His His Leu Gin Glu Val lie Leu Val Gin Thr Arg Glu 
100 105 110 



Glu Val Val Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly 
115 120 125 



Phe Glu Asp Glu lie Leu lie Pro Val Pro Ala Pro Ala Gly Gly Asp 
130 135 140 



Asp Asp Tyr lie Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys 
145 150 155 160 



Ser Gly Gly Gly Ala Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly 
165 170 175 



Gly Lys Lys Ser Gly Lys Lys Ser Tyr Leu Gly Gly Gly Ala Gly Ala 
180 185 190 



Ala Gly Gly Gly Gly Ala Asp Pro Giy Asn Lys Lys Trp Glu Gin Lys 
195 200 205 



Gin Val Gin He Lys Thr Leu Glu Gly Glu Ser Ser Val Thr Met Trp 
210 215 220 



Ser Ser Asp Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu 
225 230 235 240 



Gin lie He Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr 
245 250 255 



Gly Lys Lys Leu Pro Pro Gly Gly lie Pro Gly He As£ Leu Ser Asp 
260 265 270 



Pro Lys Gin Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys 
275 280 285 
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Glu Asp Asp Ala Pro Arg Thr lie Ala Cys Pro His Lys Gly Cys Thr 
290 295 300 



Lys Met Phe Arg Asp Asn Ser Ala Met Arg Lys His Leu His Thr His 
305 310 315 320 



Gly Pro Arg Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu 
325 330 335 



Ser Ser Lys Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro 
340 345 350 



Phe Gin Cys Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe 
355 360 365 



Asn Leu Arg Thr His Val Gly He His Thr Gly Asp Arg Pro Tyr Val 
370 375 380 



Cys Pro Phe Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu 
385 ~ 390 " 395 400 



Lys Ser His He Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 



<210> 7 

<211> 1080 

<212> DNA 

<213> Rattus norv. 

<220> 

<221> CDS 

<222> (883) . . (894) 

<223> Verkurzter Zinkfinger (BB.6S) 



<220> 

<221> CDS 

<222> (898) . . (1056) 

<223> Verkilrzter Zinkfinger (BB.6S) 



<400> 7 

atggcctcgg gcgacaccct ctacattgcc acggacggct cggagatgcc agccgagatc 60 

gtggaactgc atgagattga ggt^gagacc atcccggtgg agactatcga gaccacggtg 120 

gtgggcgagg aggaggacga cgacgaagac gacgaggatg gtggcggcgg agaccacggt 180 

ggcgggggcg gccacgggda cgctggccac caccatcacc accaccacca ccaccacccg 240 
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cccatgatcg 


cgctgcagcc 


gctggtcacc gacgacccga cccaagtgca 


ccaccaccaa 


300 


gaggtgattc 


tggtgcagac 


gcgcgaggag gtagtgggtg gcgacgactc 


ggacgggctg 


360 


cgcgccgagg 


acgggttcga 


ggaccagatc ctcattccgg tacccgcgcc 


ggccggcgga 


420 


gacgacgact 


acatcgagca 


gacgctggtc accgtggcgg cggccggcaa 


gagcggtggc 


480 


gggtcttcgt 


cgggcggcgg 


ccgcgttaag aagggcggcg gcaagaagag 


cggcaagaag 


540 


agttacctgg 


gcagcggggc 


cggcgcggcg ggcggtggcg gcgccgaccc 


gggtaataag 


600 




ajday Cay y C 


gcagatcaag accctggagg gcgagttctc 


ggtcaccatg 


£ <T (\ 

DO □ 


tggtcttcag 


atgaaaaaaa 


agatattgac catgaaacag tggttgaaga 


gcagatcatt 


720 


ggggagaact 


cacctcctga 


ttattctgaa tatatgacag gcaagaaact 


ccctcctgga 


780 


gggatacctg 


gcattgacct 


ctcagacccc aagcaactgg cagaatttgc 


cagaatgaag 


840 


ccaagaaaaa 


ttaaagaaga 


tgatgctcca agaacaatag ct tgc cct 

Cys Pro 


cat aaa 
His Lys 


894 



1 

cag tgc aca ttc gaa ggc tgc ggg aag cgc ttt tea ctg gac ttc aat 942 
Cys Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn 
5 10 15 

ttg cgc acg cat gtg cga ate cat acc gga gac agg ccc tat gtg tgc 990 
Leu Arg Thr His Val Arg lie His Thr Gly Asp Arg Pro Tyr Val Cys 
20 25 30 35 

ccc ttc gac ggt tgt aat aag aag ttt get cag tea act aac ctg aaa 1038 
Pro Phe Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys 
40 45 50 

tct cac ate tta aca cac getaaageca aaaacaacca gtga 1080 
Ser His lie Leu Thr His 
55 



<210> 8 

<211> 57 

<212> PRT 

<213> Rattus norv. 



<400> 8 



Cys Pro His Lys Cys Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu 
15 10 15 



Asp Phe Asn Leu Arg Thr His Val Arg lie His Thr Gly Asp Arg Pro 
20 25 30 



WO 2004/056857 PCT/EP2003/014762 

17 



Tyr val Cys Pro Phe Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr 
35 40 45 

Asn Leu Lys Ser His lie Leu Thr His 
50 55 
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